こんな悩み、ありませんか?
音声データを外部サーバーに送りたくない
音声データは一切外部に送信されません。すべての処理がお使いのPC上で完結します
セットアップやコマンド操作が必要なイメージ
ファイルをドラッグ&ドロップしてボタンを押すだけ。GPUの最適化もアプリが自動で行います
録音、文字起こし、編集、要約が別々のツール
録音から編集・AI分析・字幕生成まで一気通貫。ツールを行き来する手間がなくなります
毎月の費用がかさんでいく
一度購入すればずっと使える。月額¥2,000のサービスなら1〜2ヶ月分で元が取れます
既存ツールでは誤認識が多い
世界トップクラスの認識エンジンを搭載。最新のPCなら快適に動作します
主な機能
文字起こしだけじゃない。録音、編集、AI分析、動画字幕まで一気通貫
高精度ファイル文字起こし
高精度なオフライン文字起こし。tiny〜large-v3-turboまでのモデルを選択可能。10言語+自動検出に対応し、TXT・SRT・VTT・JSON・CSV・LRCの6形式で出力。複数ファイルのバッチ並列処理にも対応
- CPU / CUDA / Vulkan / OpenVINO の4バックエンド
- ドラッグ&ドロップでファイル・フォルダをまとめて追加
- 繰り返し検出・ウォッチドッグによる自動エラー回復
リアルタイム文字起こし
マイク入力やPC内部音声をリアルタイムで文字起こし。認識結果はセグメント単位でリスト表示され、全文コピーやTXT/SRTエクスポートが可能。会議、インタビュー、講義のリアルタイム記録に最適
- マイク録音と同時にリアルタイム認識
- 内部オーディオキャプチャでWeb会議も対応(Pro版)
話者分離
複数の話者がいる音声を「誰が何を話したか」まで自動で識別・分離。会議やインタビューの議事録作成に不可欠な機能で、認識結果はエディタで手軽に修正可能
- 話者数の自動検出、または手動指定(2〜10人)
- ファイルごとに話者数を個別指定可能
- 24色の自動色分けでエディタ上で視覚的に識別
エディタ
文字起こし結果を効率的に編集・修正するための専用ツール。セグメントごとの音声再生、すべてキーボードだけで操作可能な設計、自動復旧機能を備え、議事録やインタビュー記録の仕上げ作業を大幅に効率化
- セグメントの再生・分割・統合・タイムスタンプ調整をキーボードのみで操作
- 編集中にアプリが閉じても、次回起動時に自動復旧
- SRT/VTT/JSON/CSV/LRC/TXTの6形式をマルチタブで同時編集
3モード録音 & ダウンロード
マイク録音、PC内部オーディオキャプチャ(システム全体/特定アプリ指定)、YouTube/URLダウンロードの3モードを搭載。6つの音声フォーマット(WAV/FLAC/MP3/AAC/OGG/OPUS)で保存し、そのまま文字起こしに送れる
- プロセス指定キャプチャで特定アプリの音声だけ録音
- YouTube動画は音声のみ/映像付き・画質選択に対応
ローカルLLM(AI分析・要約)
ローカルで動作するAIチャット。文字起こし結果のファイルを読み込んで要約・質問応答が可能。プロンプトテンプレートのカスタマイズ、会話履歴の保存・復元、コンテキストサイズ調整など、本格的なAI分析環境
- ストリーミング応答 + Thinkingプロセス表示
- 会話のエクスポート・履歴管理
- LLMサーバーの起動/停止/再起動をGUIから制御
動画字幕の生成
文字起こし結果から動画に字幕を追加。映像に焼き付けるハードサブと、字幕トラックとして結合するソフトサブの2方式に対応。字幕のフォント・サイズ・色・位置などのスタイル設定も可能
- ハードサブ(焼き付け)/ ソフトサブ(トラック結合)
- 字幕スタイルの詳細カスタマイズ
スマートフォン連携
【開発中】Android版WhisperAppからWi-Fi経由で接続し、スマートフォンで録音してPCに送信、PCの高性能GPUで文字起こし・LLM分析という使い方が可能になる予定です
- QRコード読み取りでかんたん接続
- WebSocket対応でリアルタイムな進捗表示
モデル管理 & ModelHub
音声認識とLLMのモデルを自由に選択可能。おすすめモデルをワンクリックで導入できるだけでなく、HuggingFaceからファインチューン済みモデルを探して追加することも。GPU/VRAMの情報を自動検出し、実行可能かの判断材料も提供
- おすすめモデル付きで初心者も迷わない。上級者は任意のモデルを追加可能
- GPU/VRAM情報を自動検出し、モデルのハードウェア要件と照合可能
- 量子化バリエーション(Q4/Q5/Q8/F16)でサイズと品質のバランスを選択
エンジン自動アップデート
文字起こし・LLM・音声処理など主要エンジンの更新をアプリ内から確認・インストール。バックエンド別の適切なビルドを自動選択し、常に最新の性能を維持
- GPU環境に合わせたビルドを自動選択
- 起動時の自動チェック・ワンクリック更新
スマートバックエンド最適化
お使いのハードウェアに最適なGPUバックエンドを自動選択。電源状態もリアルタイムで検知し、パフォーマンスと省電力を自動で両立
- NVIDIA GPU(CUDA)、Intel GPU/NPU(OpenVINO)、Vulkan対応GPUを自動検出。設定不要でそのまま使える
- AC電源接続時はGPU優先、バッテリー駆動時はNPU省電力優先に自動切替
- GPUエラー発生時は別のバックエンドへ自動フォールバック。常に安定動作
- 個別にバックエンドを手動選択して固定することも可能
- Performance / Balanced / Power Saving / Auto の4プロファイルに対応
こんな方におすすめ
ライター・ジャーナリスト
インタビューや取材の録音を正確にテキスト化。議事録や記事作成の下書きに
研究者・教育者
講義・学会発表・フィールドワークの音声記録を効率的にアーカイブ
動画クリエイター
YouTube・ポッドキャストの字幕を自動生成。多言語対応でグローバル展開も
企業・法人
機密情報を外部に出さずに社内会議の議事録を自動作成。話者分離で発言者も識別
まずは無料トライアルでお試しください
7日間、Pro版相当のすべての機能を無料でご利用いただけます。クレジットカードの登録は不要です。
| 期間 | 7日間 |
| 利用可能なプラン | Pro版相当(全機能) |
| クレジットカード | 不要 |
トライアルに含まれる機能
- 高精度文字起こし(全モデル・全言語)
- 話者分離・リアルタイム文字起こし
- ローカル LLM チャット・要約
- 動画字幕生成・YouTube ダウンロード
- スマートバックエンド最適化(GPU / NPU / CPU)
トライアル期間終了後はライセンスの購入が必要です。トライアル期間中はアプリ起動時にインターネット接続が必要です。