【Python】YouTube動画の文字起こしをしてみた

こんにちはJitanTechです。

今回はYouTubeのURLを指定して文字起こしするPythonプログラムをご紹介します。

では行ってみましょう。

パッケージのインストール

まずは次の3つのパッケージをインストールしましょう。

  • pytubefix・・・YouTubeのデータを操作
  • moviepy・・・動画編集の自動化モジュール
  • openai-whisper・・・文字起こしツール

pip install pytubefix

pip install moviepy

pip install -U openai-whisper

プログラムコード

使用方法

文字起こしするYouTubeのURLをこの部分に書きましょう!

# YouTube動画をロード
yt = YouTube(“https://www.youtube.com/watch?v=4O-mCluNTQk“)

文字起こしの精度を上げる場合「small」の部分を「medium」または「large」にしましょう。お使いのPCにNVIDIA製のGPUが搭載されている場合は「cpu」の部分を「cuda」にすると高速で処理してくれます。

# 処理
model = whisper.load_model(“small“, device=”cpu“)

実行結果

文字起こしされたデータがターミナルに出力されます。

処理が完了すると、文字起こしデータが同じ階層に output.txt が出力されます。

エラーが出る場合

エラーが出る場合は次を確かめてみてください。

Pythonのバージョンは 3.8~3.10 か

これは音声認識ツールWhisperが上記のバージョンしか対応していないためです。

numpyパッケージのバージョンは2より小さいか

Whisperをインストールするとnumpyもインストールされますが、おそらくnumpyのバージョンは2以上jがインストールされます。下の記事ではnumpyをアンインストールしてnumpy1.26.4をインストールする方法をご紹介しています。

【Python】Whisperで音声ファイルの文字起こしをローカル環境で行う
Pythonを用いてWhisperで音声ファイルの文字起こしをローカル環境で行う方法とエラーの対処法をご紹介します。

さいごに

今回はYouTubeの動画の音声を文字起こしする方法をご紹介しました。

今回ご紹介したWhisperの文字起こし精度はYouTubeの自動字幕よりもはるかにいいですので、需要はあるのではないかと思います。例えば時間がない時に内容を知りたい場合は文字起こしして文章を読むとだいぶ時短できるのではないでしょうか。

便利なものはどんどん活用していきましょう!それではまた。

コメント