完全オフラインGPU高速化対応多言語対応

自分だけのAI文字起こし環境を
デスクトップに。

難しい設定は不要。高精度な音声認識、編集、AI分析をオールインワンで提供。月額料金なしの買い切り型 — すべてオフラインで動くWindowsデスクトップアプリ

ダウンロード価格

Windows 10/11 (64-bit) 対応

こんな悩み、ありませんか？

クラウド型はプライバシーが不安

音声データを外部サーバーに送りたくない

完全ローカル処理

音声データは一切外部に送信されません。すべての処理がお使いのPC上で完結します

AIの文字起こしは難しそう

セットアップやコマンド操作が必要なイメージ

難しい設定は不要

ファイルをドラッグ&ドロップしてボタンを押すだけ。GPUの最適化もアプリが自動で行います

ツールが分散して非効率

録音、文字起こし、編集、要約が別々のツール

オールインワン

録音から編集・AI分析・字幕生成まで一気通貫。ツールを行き来する手間がなくなります

月額サブスクが高い

毎月の費用がかさんでいく

買い切り型

一度購入すればずっと使える。月額¥2,000のサービスなら1〜2ヶ月分で元が取れます

文字起こしの精度が低い

既存ツールでは誤認識が多い

OpenAI Whisper搭載

世界トップクラスの認識エンジンを搭載。最新のPCなら快適に動作します

主な機能

文字起こしだけじゃない。録音、編集、AI分析、動画字幕まで一気通貫

高精度ファイル文字起こし

高精度なオフライン文字起こし。tiny〜large-v3-turboまでのモデルを選択可能。10言語+自動検出に対応し、TXT・SRT・VTT・JSON・CSV・LRCの6形式で出力。複数ファイルのバッチ並列処理にも対応

CPU / CUDA / Vulkan / OpenVINO の4バックエンド
ドラッグ&ドロップでファイル・フォルダをまとめて追加
繰り返し検出・ウォッチドッグによる自動エラー回復

リアルタイム文字起こし

マイク入力やPC内部音声をリアルタイムで文字起こし。認識結果はセグメント単位でリスト表示され、全文コピーやTXT/SRTエクスポートが可能。会議、インタビュー、講義のリアルタイム記録に最適

マイク録音と同時にリアルタイム認識
内部オーディオキャプチャでWeb会議も対応（Pro版）

話者分離

複数の話者がいる音声を「誰が何を話したか」まで自動で識別・分離。会議やインタビューの議事録作成に不可欠な機能で、認識結果はエディタで手軽に修正可能

話者数の自動検出、または手動指定（2〜10人）
ファイルごとに話者数を個別指定可能
24色の自動色分けでエディタ上で視覚的に識別

エディタ

文字起こし結果を効率的に編集・修正するための専用ツール。セグメントごとの音声再生、すべてキーボードだけで操作可能な設計、自動復旧機能を備え、議事録やインタビュー記録の仕上げ作業を大幅に効率化

セグメントの再生・分割・統合・タイムスタンプ調整をキーボードのみで操作
編集中にアプリが閉じても、次回起動時に自動復旧
SRT/VTT/JSON/CSV/LRC/TXTの6形式をマルチタブで同時編集

3モード録音 & ダウンロード

マイク録音、PC内部オーディオキャプチャ（システム全体/特定アプリ指定）、YouTube/URLダウンロードの3モードを搭載。6つの音声フォーマット（WAV/FLAC/MP3/AAC/OGG/OPUS）で保存し、そのまま文字起こしに送れる

プロセス指定キャプチャで特定アプリの音声だけ録音
YouTube動画は音声のみ/映像付き・画質選択に対応

ローカルLLM（AI分析・要約）

ローカルで動作するAIチャット。文字起こし結果のファイルを読み込んで要約・質問応答が可能。プロンプトテンプレートのカスタマイズ、会話履歴の保存・復元、コンテキストサイズ調整など、本格的なAI分析環境

ストリーミング応答 + Thinkingプロセス表示
会話のエクスポート・履歴管理
LLMサーバーの起動/停止/再起動をGUIから制御

動画字幕の生成

文字起こし結果から動画に字幕を追加。映像に焼き付けるハードサブと、字幕トラックとして結合するソフトサブの2方式に対応。字幕のフォント・サイズ・色・位置などのスタイル設定も可能

ハードサブ（焼き付け）/ ソフトサブ（トラック結合）
字幕スタイルの詳細カスタマイズ

スマートフォン連携

【開発中】Android版WhisperAppからWi-Fi経由で接続し、スマートフォンで録音してPCに送信、PCの高性能GPUで文字起こし・LLM分析という使い方が可能になる予定です

QRコード読み取りでかんたん接続
WebSocket対応でリアルタイムな進捗表示

モデル管理 & ModelHub

音声認識とLLMのモデルを自由に選択可能。おすすめモデルをワンクリックで導入できるだけでなく、HuggingFaceからファインチューン済みモデルを探して追加することも。GPU/VRAMの情報を自動検出し、実行可能かの判断材料も提供

おすすめモデル付きで初心者も迷わない。上級者は任意のモデルを追加可能
GPU/VRAM情報を自動検出し、モデルのハードウェア要件と照合可能
量子化バリエーション（Q4/Q5/Q8/F16）でサイズと品質のバランスを選択

エンジン自動アップデート

文字起こし・LLM・音声処理など主要エンジンの更新をアプリ内から確認・インストール。バックエンド別の適切なビルドを自動選択し、常に最新の性能を維持

GPU環境に合わせたビルドを自動選択
起動時の自動チェック・ワンクリック更新

スマートバックエンド最適化

お使いのハードウェアに最適なGPUバックエンドを自動選択。電源状態もリアルタイムで検知し、パフォーマンスと省電力を自動で両立

NVIDIA GPU（CUDA）、Intel GPU/NPU（OpenVINO）、Vulkan対応GPUを自動検出。設定不要でそのまま使える
AC電源接続時はGPU優先、バッテリー駆動時はNPU省電力優先に自動切替
GPUエラー発生時は別のバックエンドへ自動フォールバック。常に安定動作
個別にバックエンドを手動選択して固定することも可能
Performance / Balanced / Power Saving / Auto の4プロファイルに対応

こんな方におすすめ

ライター・ジャーナリスト

インタビューや取材の録音を正確にテキスト化。議事録や記事作成の下書きに

研究者・教育者

講義・学会発表・フィールドワークの音声記録を効率的にアーカイブ

動画クリエイター

YouTube・ポッドキャストの字幕を自動生成。多言語対応でグローバル展開も

企業・法人

機密情報を外部に出さずに社内会議の議事録を自動作成。話者分離で発言者も識別

ブログ

文字起こしに役立つ情報

2026年5月7日

ウイルス対策ソフトの警告について — WhisperApp 安全インストールガイド

2026年3月10日

Moonshine Voice ASR とは？Whisperに代わるエッジ向け音声認識モデルを解説

2026年3月3日

文字起こしツールのプライバシーリスクとは？クラウド型とローカル型を徹底比較

すべての記事を見る

まずは無料トライアルでお試しください

7日間、Pro版相当のすべての機能を無料でご利用いただけます。クレジットカードの登録は不要です。

期間	7日間
利用可能なプラン	Pro版相当（全機能）
クレジットカード	不要

トライアルに含まれる機能

高精度文字起こし（全モデル・全言語）
話者分離・リアルタイム文字起こし
ローカル LLM チャット・要約
動画字幕生成・YouTube ダウンロード
スマートバックエンド最適化（GPU / NPU / CPU）

トライアル期間終了後はライセンスの購入が必要です。トライアル期間中はアプリ起動時にインターネット接続が必要です。

ダウンロード

自分だけのAI文字起こし環境をデスクトップに。