Speech Indexer はOpenAI社が開発した音声認識システム「Whisper」に基づく「音声・映像コーパス構築ツール」です。特に、Georgi Gerganov 氏が開発した Whisper.cpp を MinGW-w64 でコンパイルして利用しています。Whisper の詳細についてはOpenAIのサイトをご覧ください。
※インストールされていない場合は「こちら」からランタイムをダウンロードしてください (.NET 6 以降は未検証です)。
Speech Indexer をダウンロードし、解凍してください。基本となるモデルファイル "ggml-base.bin" はプログラムに同梱していますが、必要に応じて「Hugging Face」からモデルファイルをダウンロードしてください。モデルサイズが大きければ精度は向上しますが、処理時間も増加します。ダウンロードしたモデルファイルは、"SpeechIndexer" フォルダ内の "Whisper.cpp" -> "models" フォルダ内にコピーして下さい。 ※同梱している "ggml-base.bin" では、日本語認識には精度が不十分かと思われます。最低でも small 以上をお勧めします。
"SpecchIndexer" フォルダを削除してください。レジストリはいじってません。
Copyright (c) 2022 OpenAI, Released under the MIT License,
see https://github.com/openai/whisper/blob/main/LICENSE
Copyright (c) 2023 Georgi Gerganov, Released under the MIT License,
see https://github.com/ggerganov/whisper.cpp/blob/master/LICENSE
Copyright (c) 2020 Mark Heath, Released under the MIT License,
see https://github.com/naudio/NAudio/blob/master/license.txt
Copyright (c) 2009-2022 Josh Close, Released under the Apache v2.0 license,
see https://github.com/JoshClose/CsvHelper/blob/master/LICENSE.txt
参照して頂ける場合は以下の様式をご使用ください。
・後藤一章. (2023). Speech Indexer (Version 0.xx) [Computer Software]. Retrieved from: https://www.setsunan.ac.jp/~corpus/SpeechIndexer.htm
・Goto, K. (2023). Speech Indexer (Version 0.xx) [Computer Software]. Retrieved from: https://www.setsunan.ac.jp/~corpus/SpeechIndexer_en.htm
(1)、(2) 文字起こしするファイルを選択します。
(1) の「ファイル」ボタンを押すと、以下のメニューが表示されます。
(3) 文字起こしの設定を行います。
(4)、(5)
(6), (8) 検索する文字起こしファイルを選択します。
(6) の「ファイル」ボタンを押すと、以下のメニューが表示されます。
(7) 検索語を指定します。単語 (Word) か正規表現 (RegEX) を選択できます。
(9) (8) のファイルをダブルクリックすると内容が表示されます。
(10) 検索語句を含むセグメントの「ファイル名」「開始時間」「終了時間」「テキスト」を表示します。ダブルクリックすると別ウィンドウで該当箇所を再生します。
(11) 再生中のメディアがWMPで表示されます。
(12)
Repeat: 現在再生中のセグメントをリピート再生します。
Edit Mode: 表示している文字起こしファイルの編集が可能になります。
(13) 現在再生しているセグメントの「ファイル名」「開始時間」「終了時間」「テキスト」を表示します。任意のセグメントをダブルクリックするとそのセグメントに移動します。
1 作者のウェブサイトにて公開している Speech Indexer(以下「本件ソフトウェア」)はフリーウェアとし、個人利用、教育研究利用、商用利用を問わず、無料で使用できます。
2 本件ソフトウェアの著作権は、作者に帰属します。
3 以下の行為を禁止します。
(1)本件ソフトウェアの販売やリース等によって第三者から対価を得ること
(2)本件ソフトウェアを使用し、第三者の知的財産権の侵害、または第三者の名誉や信用を毀損もしくは誹謗中傷する行為
(3)本件ソフトウェアのリバースエンジニアリング、逆コンパイルまたは逆アセンブル
(4)本件ソフトウェアの無断での再配布
(5)その他、作者に損害をもたらす行為
4 作者は、本件ソフトウェアの提供を廃止することがあります。提供の廃止によって利用者に発生した損害について、作者は一切責任を負いません。
5 本件ソフトウェアを使用すること、または、本件ソフトウェアを使用できなかったことに関して発生した損害について、作者は一切責任を負いません。また、本件ソフトウェアに不具合があった場合であっても、作者は修復の義務を負いません。
6 本規約は、作者が利用者に事前告知なく変更いたします。変更後の規約は、作者のウェブサイトに掲載されたときに効力を発生します。
以上
Version 0.22 (2023/12) 不具合修正
Version 0.21 (2023/12) 不具合修正
Version 0.2 (2023/10) プロンプト機能追加
Version 0.11 (2023/09) 不具合修正
Version 0.1 (2023/09) 公開開始