ChatGPT の登場により、音声入力の出番がますます増えてくると感じましたので、改めて音声入力の方法を整理することにしました。
ChatGPTに音声入力をする方法
まずはChatGPT に音声入力をするというシチュエーションを想定します。
Google Chromeを使っているなら、 拡張機能に音声入力のソフトがありますのでこちらをダウンロード&インストールするだけで OK です。
Voice In – Speech-To-Text Dictation
https://chrome.google.com/webstore/detail/voice-in-speech-to-text-d/pjnefijmagpdjfhhkpljicbbpicelgko
インストール後、ブラウザ画面の右上のマイクのボタン押して、マイクに向かって話しかけることで音声入力することができます。
使ってみたところなかなか精度も良くて、多少間違うこともあるけれど、色々と試しながら話しながら入力するというのは、タイピングが遅い人にとっては特に便利な機能かなと思います。
Macで文字起こしをする (kindle出版に向けて)
続いて、個人的な話なんですけども、 Kindle 出版をしたいなと思うようになりまして。
Udemy向けに動画を作っていましたので、その動画から文字起こしをして、電子書籍の形にしたいなと思い、その方法を探っておりました。
動画ファイルは mp4 形式なんですけども何でもOKと思います。
mp4動画ファイルを再生したら、それがどんどんと文字起こしされたらいいなということで、その方法を探していて見つけました。
再生している動画の音声の出力と、その音声を入力として文字起こししたいと。
出力と入力を同時に行うソフトですね。
それを実現するアプリとして、『Blackhole(ブラックホール)』というものがあります。
https://existential.audio/blackhole/
メールアドレス、氏名を登録し、届いたメールをクリックすることでダウンロードできます。
2ch、16ch、64chと3種類ありましたが、16chもあれば問題ないかなと。
インストールし、システム設計から音声の入力、出力ともにBlackHoleにすれば、
動画を文字入力することができるようになりました。
動画から文字起こしする方法
文字起こしの方法は色々あるんですが、
無料で使えるものとして Google ドキュメントの音声入力を使っています。
Google ドキュメントのツールから音声入力を選び、マイクのボタンを押して音声入力できるようになります。
画面を切り替えると止まってしまうので、
先にMP 4を再生し、すぐに Google ドキュメントのマイクのボタンを押してあげると。
0.5秒ぐらい最初だけ録音できないんだけど、後はもう自動的にザーッと入力できるので、映像を流しながら文字起こしがされているのをぼーっと眺めておけばokです。
出力後、必要があれば少し訂正したりレイアウトを整えたり、
ちょっと変だなぁと思ったらChatGPT に改定してもらってから Kindle 出版するということもできるかなと思います。
動画コンテンツや音声コンテンツを持っている方で、文字起こしをして Kindle 出版するということを検討している場合はぜひぜひこちらも試してみていただければと思います。
まとめ
本当にChatGPT によっていろんな業界に影響が出てくることが予想されていますけども、もうこれは変えられないと言うか止められない流れ、変化になるかなと。
うまいことこのビッグウェーブに乗っかって、楽しく時代を乗り越えていきたいなと思っているし、それについての情報発信をまたしていきますので、
ぜひ皆さんで協力しながらこの荒波を乗り越えていきましょう。
この記事へのコメントはありません。