現在販売準備中です — 近日販売開始予定

機能紹介

WhisperAppでできること — 使い方に沿って機能をご紹介します

すべてオフラインで完結

WhisperAppの全機能はインターネット接続なしで動作します。音声データがサーバーに送信されることはなく、プライバシーを完全に保護。機密性の高い会議録やインタビューも安心して処理できます。

音声データ送信なし完全ローカル処理ライセンス認証もオフライン

ファイル文字起こし

音声・動画ファイルをドラッグ&ドロップで追加し、ワンクリックで高精度なテキストに変換。会議録やインタビュー、講演の記録など、さまざまな音声の文字起こしに対応します。

1音声・動画ファイルをウィンドウにドラッグ&ドロップ(フォルダごと追加も可能)
2Whisperモデル(tiny〜large-v3-turbo)と認識言語(10言語+自動検出)を選択
3出力形式(TXT/SRT/VTT/JSON/CSV/LRC)を選び、実行ボタンをクリック
4プログレスバーで進捗を確認。完了したファイルは右クリックですぐに開ける
  • CUDA / OpenVINO / Vulkan / CPU の4バックエンドを自動選択
  • バッチ並列処理で複数ファイルを同時に文字起こし
  • 繰り返し検出・ウォッチドッグで処理エラーを自動回復
  • 完了済みタスクから直接エディタやLLMで開ける

リアルタイム文字起こし

マイクやPC内部の音声を録音しながら、リアルタイムでテキスト化。会議やインタビューの最中にメモを取る必要がなくなります。

1録音ウィンドウを開き、マイクまたは内部オーディオを選択
2「リアルタイム文字起こし」をONにして、モデルと言語を設定
3録音開始 — 話した内容がリアルタイムでセグメントリストに表示される
4「すべてコピー」でクリップボードへ、またはTXT/SRTでエクスポート
  • マイク録音との同時動作 — 録音ファイルとテキストの両方を取得
  • PC内部音声(システム全体/特定アプリ)のリアルタイム認識(Pro版)
  • レベルメーターで入力音量をリアルタイム確認

話者分離Pro版

複数の話者がいる音声から「誰が何を話したか」を自動で識別。会議やインタビューの議事録作成に不可欠な機能です。

1文字起こし画面で「話者分離」チェックボックスをONにする
2話者数を設定(自動検出、または2〜10人の範囲で手動指定)
3文字起こしを実行 — 各セグメントに話者タグが自動で付与される
4結果をエディタで開き、必要に応じて話者タグの修正や統合を行う
  • 専用エンジンによる高精度な話者分離
  • 話者数の自動検出 / 手動指定(2〜10人)をファイルごとに設定可能
  • 24色パレットによる話者色分けでエディタ・音声バー上で視覚的に識別
  • 話者タグの追加・名前変更・削除、バッチでの話者変更にも対応

エディタ

文字起こし結果を効率的に仕上げるための専用編集ツール。話者分離の有無にかかわらず使用でき、セグメントごとの音声再生、キーボードだけで完結する操作体系、自動復旧機能を備えています。議事録やインタビュー記録の校正作業を大幅に効率化します。

1文字起こし完了後、右クリック→「編集」でエディタを開く(6形式に対応: SRT/VTT/JSON/CSV/LRC/TXT)
2セグメントを選択し、再生ボタンまたは Shift+Space で音声を確認しながらテキストを修正(Eキーで即座に編集開始)
3必要に応じてセグメントの分割(D)・統合(M)・タイムスタンプ調整(T)・話者タグ変更(S)を実行
4Ctrl+S で保存。すべての操作はアンドゥ(Ctrl+Z)可能で、編集途中の状態は自動保存される
  • 全操作がキーボードのみで完結(E=編集, D=分割, M=統合, T=タイミング, S=話者, Space=再生, ↑↓=移動)
  • 自動復旧: 編集中にアプリが閉じてもPCが落ちても、次回起動時に編集途中の状態から復元
  • 話者色分け付き音声バー — クリックでシーク、全体の構成を視覚的に把握
  • 変速再生(0.5x〜2.0x)— 速度変更用の音声ファイルをバックグラウンドで事前生成
  • マルチタブ対応 — 複数ファイルを独立した状態で同時に編集
  • 11種類の操作すべてにアンドゥ/リドゥ対応(テキスト編集、話者変更、分割、統合、削除、挿入、タイミング調整など)
  • セグメントのタイムスタンプ調整時、隣接セグメントとの重なりを自動検出して解決策を提案

3モード録音 & ダウンロード

マイク、PC内部音声、YouTube/URL ダウンロードの3つの方法で音声を取得。録音した音声はそのまま文字起こしキューに追加できるので、録音→文字起こしの流れがシームレスです。

マイク録音

デバイスを選んで録音開始。WAV/FLAC/MP3/AAC/OGG/OPUSの6フォーマットで保存。リアルタイム文字起こしとの併用も可能。

内部オーディオキャプチャ(Pro版)Pro版

PCから出力される音声をキャプチャ。システム全体の音声はもちろん、特定のアプリケーション(Zoom、Teams等)を指定して、そのアプリの音声だけを録音することも可能。

YouTube/URLダウンロード(Pro版)Pro版

YouTubeなどの動画URLを貼り付けてダウンロード。音声のみ抽出や、映像付き(画質選択)にも対応。ダウンロード後は自動で文字起こしキューに追加。

  • 録音完了後にファイルリストへ自動追加
  • レベルメーターと録音タイマーでリアルタイムモニタリング

ローカルLLM(AI分析・要約)Pro版

ローカルで動作するAIチャット機能。文字起こし結果を読み込ませて「要約して」「重要なポイントは?」と質問するだけで、AIが内容を分析。すべてローカルで処理されるため、機密データも安全に扱えます。

1要約ウィンドウを開き、文字起こし結果のファイルを追加(完了リストから直接開くことも可能)
2プロンプトスタイルを選択(要約、議事録作成、翻訳など — カスタム作成も可能)
3「要約実行」をクリック、またはチャット欄に自由に質問を入力して送信
4AIの回答を確認。会話は履歴に自動保存され、いつでも復元・エクスポートできる
  • ストリーミング応答でリアルタイムにAIの回答を表示
  • プロンプトテンプレートを自由に作成・編集・管理
  • 会話履歴の保存・名前変更・復元・エクスポート
  • コンテキストサイズの調整、LLMサーバーの起動/停止をGUIから制御

動画字幕の生成Pro版

文字起こし結果を使って、動画に字幕を追加。焼き付け(ハードサブ)とトラック埋め込み(ソフトサブ)の2つの方式に対応し、YouTubeアップロード用の字幕ファイルとしても活用できます。

1エディタでファイルを開き、必要に応じてテキストを修正
2「字幕」ボタンをクリックし、対象の動画ファイルを選択
3焼き付け(ハードサブ)または結合(ソフトサブ)を選び、スタイルを設定
4「実行」で字幕付き動画を出力
  • ハードサブ: 映像に直接焼き付け(どの環境でも字幕表示)
  • ソフトサブ: 字幕トラックとして埋め込み(ON/OFF切替可能)
  • フォント・サイズ・色・位置などのスタイルをカスタマイズ

スマートフォン連携Pro版

Android版WhisperApp(無料)と連携して、スマートフォンで手軽に録音し、PCのGPU性能を活かした高速・高精度な文字起こしが可能。外出先での録音をデスクで処理するワークフローに最適です。(現在開発中 — 今後のアップデートで提供予定)

1PC版の設定からAPIサーバーを起動
2QRコードを表示し、Android版WhisperAppで読み取って接続
3スマートフォンで録音し、PCに送信して文字起こし
4結果はスマートフォン上でリアルタイムに確認
  • Wi-Fi経由のローカル通信 — インターネット不要
  • WebSocketで文字起こしの進捗をリアルタイム表示
  • PCのGPU(CUDA/OpenVINO/Vulkan)をスマホから活用

モデル管理 & ModelHub

音声認識とLLMで使用するAIモデルを自由に選択・管理できます。初心者にはおすすめモデルを提示し、上級者にはHuggingFaceから任意のモデルを追加する自由を提供。GPU/VRAM情報の自動検出により、自分の環境で実行可能かどうかの判断もサポートします。

1ModelHub(同梱のモデル管理ツール)を起動し、ASR(音声認識)またはLLMタブを選択
2おすすめバッジ付きのモデルから選ぶか、量子化バリエーション(Q4/Q5/Q8/F16)から品質とサイズのバランスを選択
3「ダウンロード」をクリック — 進捗・速度・残り時間がリアルタイム表示される
4WhisperAppを起動するとダウンロードしたモデルが自動検出され、ドロップダウンから選択可能に
  • おすすめモデル: 各サイズに最適な量子化を「おすすめ」バッジで表示。迷わず導入できる
  • カスタムモデル: HuggingFace検索や直接URLから任意のモデルを追加可能(FTモデル等)
  • GPU/VRAM自動検出: ハードウェア情報を自動取得し、ステータスバーに表示
  • LLMモデルにはVRAM/RAM要件が記載されており、自分の環境との照合が容易
  • ASR 6モデル × 量子化 + LLM 12+シリーズ — 豊富なモデルライブラリ
  • 最大3ファイル同時ダウンロード、ダウンロード済みモデルの一覧管理・削除

エンジン自動アップデート

文字起こし・LLM・音声処理など主要エンジンの更新確認・インストールをアプリ内で完結。GPUバックエンドに合ったビルドを自動選択するので、手動での差し替え作業は不要です。

  • 設定画面の「更新」タブから全エンジンの状態を一覧確認
  • ワンクリックで個別にアップデート・インストール
  • 起動時の自動チェックと自動インストールに対応
  • GPU環境に合わせたビルドを自動選択(CUDA/OpenVINO/Vulkan/CPU)

スマートバックエンド最適化

お使いのハードウェアに最適なGPUバックエンドを自動選択。電源状態もリアルタイムで検知し、ノートPCではパフォーマンスと省電力を自動で両立します。設定を一切触らなくても、常に最適な状態で動作します。

AC電源接続時

GPU優先で最大パフォーマンスを発揮。CPUリソースもフル活用し、最速の処理を実現します。

バッテリー駆動時

NPU優先の省電力動作。CPUリソースの使用を抑え、バッテリー持続時間を最大化します。

  • NVIDIA GPU(CUDA)、Intel GPU/NPU(OpenVINO)、Vulkan対応GPUを自動検出し、最適なバックエンドを選択
  • 電源の抜き差しをリアルタイム検知し、パフォーマンスモードと省電力モードを自動切替
  • GPUエラー発生時は別のバックエンドへ自動フォールバック。常に安定動作
  • Performance / Balanced / Power Saving / Auto の4プロファイルから選択可能
  • 個別にバックエンドを手動選択して固定することも可能
  • エンジンごとに対応バックエンドが異なり、それぞれに最適な組み合わせを自動判定

今すぐダウンロード

高精度な文字起こし、話者分離、リアルタイム認識、ローカルLLMチャットを搭載

ダウンロード