現在販売準備中です — 近日販売開始予定

完全オフラインGPU高速化対応多言語対応

自分だけのAI文字起こし環境を
デスクトップに。

難しい設定は不要。高精度な音声認識、編集、AI分析をオールインワンで提供。月額料金なしの買い切り型 — すべてオフラインで動くWindowsデスクトップアプリ

Windows 10/11 (64-bit) 対応

こんな悩み、ありませんか?

クラウド型はプライバシーが不安

音声データを外部サーバーに送りたくない

完全ローカル処理

音声データは一切外部に送信されません。すべての処理がお使いのPC上で完結します

AIの文字起こしは難しそう

セットアップやコマンド操作が必要なイメージ

難しい設定は不要

ファイルをドラッグ&ドロップしてボタンを押すだけ。GPUの最適化もアプリが自動で行います

ツールが分散して非効率

録音、文字起こし、編集、要約が別々のツール

オールインワン

録音から編集・AI分析・字幕生成まで一気通貫。ツールを行き来する手間がなくなります

月額サブスクが高い

毎月の費用がかさんでいく

買い切り型

一度購入すればずっと使える。月額¥2,000のサービスなら1〜2ヶ月分で元が取れます

文字起こしの精度が低い

既存ツールでは誤認識が多い

OpenAI Whisper搭載

世界トップクラスの認識エンジンを搭載。最新のPCなら快適に動作します

主な機能

文字起こしだけじゃない。録音、編集、AI分析、動画字幕まで一気通貫

高精度ファイル文字起こし

高精度なオフライン文字起こし。tiny〜large-v3-turboまでのモデルを選択可能。10言語+自動検出に対応し、TXT・SRT・VTT・JSON・CSV・LRCの6形式で出力。複数ファイルのバッチ並列処理にも対応

  • CPU / CUDA / Vulkan / OpenVINO の4バックエンド
  • ドラッグ&ドロップでファイル・フォルダをまとめて追加
  • 繰り返し検出・ウォッチドッグによる自動エラー回復

リアルタイム文字起こし

マイク入力やPC内部音声をリアルタイムで文字起こし。認識結果はセグメント単位でリスト表示され、全文コピーやTXT/SRTエクスポートが可能。会議、インタビュー、講義のリアルタイム記録に最適

  • マイク録音と同時にリアルタイム認識
  • 内部オーディオキャプチャでWeb会議も対応(Pro版)

話者分離

複数の話者がいる音声を「誰が何を話したか」まで自動で識別・分離。会議やインタビューの議事録作成に不可欠な機能で、認識結果はエディタで手軽に修正可能

  • 話者数の自動検出、または手動指定(2〜10人)
  • ファイルごとに話者数を個別指定可能
  • 24色の自動色分けでエディタ上で視覚的に識別

エディタ

文字起こし結果を効率的に編集・修正するための専用ツール。セグメントごとの音声再生、すべてキーボードだけで操作可能な設計、自動復旧機能を備え、議事録やインタビュー記録の仕上げ作業を大幅に効率化

  • セグメントの再生・分割・統合・タイムスタンプ調整をキーボードのみで操作
  • 編集中にアプリが閉じても、次回起動時に自動復旧
  • SRT/VTT/JSON/CSV/LRC/TXTの6形式をマルチタブで同時編集

3モード録音 & ダウンロード

マイク録音、PC内部オーディオキャプチャ(システム全体/特定アプリ指定)、YouTube/URLダウンロードの3モードを搭載。6つの音声フォーマット(WAV/FLAC/MP3/AAC/OGG/OPUS)で保存し、そのまま文字起こしに送れる

  • プロセス指定キャプチャで特定アプリの音声だけ録音
  • YouTube動画は音声のみ/映像付き・画質選択に対応

ローカルLLM(AI分析・要約)

ローカルで動作するAIチャット。文字起こし結果のファイルを読み込んで要約・質問応答が可能。プロンプトテンプレートのカスタマイズ、会話履歴の保存・復元、コンテキストサイズ調整など、本格的なAI分析環境

  • ストリーミング応答 + Thinkingプロセス表示
  • 会話のエクスポート・履歴管理
  • LLMサーバーの起動/停止/再起動をGUIから制御

動画字幕の生成

文字起こし結果から動画に字幕を追加。映像に焼き付けるハードサブと、字幕トラックとして結合するソフトサブの2方式に対応。字幕のフォント・サイズ・色・位置などのスタイル設定も可能

  • ハードサブ(焼き付け)/ ソフトサブ(トラック結合)
  • 字幕スタイルの詳細カスタマイズ

スマートフォン連携

【開発中】Android版WhisperAppからWi-Fi経由で接続し、スマートフォンで録音してPCに送信、PCの高性能GPUで文字起こし・LLM分析という使い方が可能になる予定です

  • QRコード読み取りでかんたん接続
  • WebSocket対応でリアルタイムな進捗表示

モデル管理 & ModelHub

音声認識とLLMのモデルを自由に選択可能。おすすめモデルをワンクリックで導入できるだけでなく、HuggingFaceからファインチューン済みモデルを探して追加することも。GPU/VRAMの情報を自動検出し、実行可能かの判断材料も提供

  • おすすめモデル付きで初心者も迷わない。上級者は任意のモデルを追加可能
  • GPU/VRAM情報を自動検出し、モデルのハードウェア要件と照合可能
  • 量子化バリエーション(Q4/Q5/Q8/F16)でサイズと品質のバランスを選択

エンジン自動アップデート

文字起こし・LLM・音声処理など主要エンジンの更新をアプリ内から確認・インストール。バックエンド別の適切なビルドを自動選択し、常に最新の性能を維持

  • GPU環境に合わせたビルドを自動選択
  • 起動時の自動チェック・ワンクリック更新

スマートバックエンド最適化

お使いのハードウェアに最適なGPUバックエンドを自動選択。電源状態もリアルタイムで検知し、パフォーマンスと省電力を自動で両立

  • NVIDIA GPU(CUDA)、Intel GPU/NPU(OpenVINO)、Vulkan対応GPUを自動検出。設定不要でそのまま使える
  • AC電源接続時はGPU優先、バッテリー駆動時はNPU省電力優先に自動切替
  • GPUエラー発生時は別のバックエンドへ自動フォールバック。常に安定動作
  • 個別にバックエンドを手動選択して固定することも可能
  • Performance / Balanced / Power Saving / Auto の4プロファイルに対応

こんな方におすすめ

ライター・ジャーナリスト

インタビューや取材の録音を正確にテキスト化。議事録や記事作成の下書きに

研究者・教育者

講義・学会発表・フィールドワークの音声記録を効率的にアーカイブ

動画クリエイター

YouTube・ポッドキャストの字幕を自動生成。多言語対応でグローバル展開も

企業・法人

機密情報を外部に出さずに社内会議の議事録を自動作成。話者分離で発言者も識別

まずは無料トライアルでお試しください

7日間、Pro版相当のすべての機能を無料でご利用いただけます。クレジットカードの登録は不要です。

期間7日間
利用可能なプランPro版相当(全機能)
クレジットカード不要

トライアルに含まれる機能

  • 高精度文字起こし(全モデル・全言語)
  • 話者分離・リアルタイム文字起こし
  • ローカル LLM チャット・要約
  • 動画字幕生成・YouTube ダウンロード
  • スマートバックエンド最適化(GPU / NPU / CPU)

トライアル期間終了後はライセンスの購入が必要です。トライアル期間中はアプリ起動時にインターネット接続が必要です。