【Python】YouTuberの全動画を連続で文字起こしする方法

Python

この記事を読むことで以下の方法がわかります。

・特定のYoutuberの動画を連続で文字起こしする方法。

今回はGoogleColab環境※無料で使用できます。で動作させます。

※Google Colab は、ブラウザから Python を実行できるGoogleが提供しているサービスです。

GoogleColabにアクセスする

まず初めに以下のURLからGoogleColabにアクセスします。

ノートブックの新規作成

以下の画面が表示されますので、ノートブックの新規作成をクリックしましょう。

※詳しくは以下のサイトの「GoogleColabにアクセスする」をご覧ください。

https://jitantech.com/how-to-use-whisper-on-google-colab/

コードの入力

「+コード」をクリックし、コードブロックを表示しましょう。ここにコードを記入します。

GoogleColabのノートブックにプログラムを1つずつ貼り付けましょう。一つ貼り付け終わったらGoogleColab画面の左上にある「+コード」をクリックして枠を増やしてください

①Googleドライブへアクセスするコード

※GoogleColabからご自身のGoogleドライブにアクセスするための記述です。

②文字起こしのパッケージ

※Open-AI社が公開している文字起こしのパッケージ。

③YouTube動画のダウンロード

※Youtube動画をダウンロードするパッケージ。

④音声ファイルへの変換

※動画から音声ファイルを抽出するパッケージ。

⑤YouTubeAPI

※YoutubeAPIを使用するためのパッケージ。

メイン実行プログラム

使用方法

今回、特定のチャンネルから動画一覧を取得するためにYouTubeAPIを使用しています。YouTubeAPIを使用するにはAPIキーを取得する必要があります。

YoutubeAPIキーの取得

こちらの記事を参考にAPIキーを取得しましょう!

【Youtube】APIキーの取得手順(2021/04/08時点のキャプチャ) - Qiita
はじめにYoutubeのAPIがあれば動画情報の取得が出来ます。YoutubeはWEBスクレイピングを規約違反としているのでAPI経由で情報を取得する必要があります。私は↓のPythonライブ…
APIキーをプログラムに記載

取得したAPIキーをプログラムの次の部分に記載しましょう。

#——-↓パラメータ入力↓——-

developerKey = “ここに自身のAPIキー
channel_id = “ここにYouTuberのチャンネルID”

#——-↑パラメータ入力↑——-

YouTuberのチャンネルIDを調べる

こちらのサイトでYouTuberのチャンネルIDを調べましょう。

他人のYouTubeのチャンネルIDを調べる - ilr - アイ・エル・アール
概要 自分自身のチャンネルIDはYouTube Studio>カスタマイズ>基本情報 で確認することができますが、他人のチャンネルでカスタム URLを使用されているチャンネルはチャンネルIDがわかりません。 ソースから確
チャンネルIDをプログラムに記載

調査したチャンネルIDをプログラムの次の部分に記載しましょう。

#——-↓パラメータ入力↓——-

developerKey = “ここに自身のAPIキー”
channel_id = “ここにYouTuberのチャンネルID

#——-↑パラメータ入力↑——-

GoogleColabのランタイムのタイプを変更

GoogleColabの画面にあるランタイムのタイプを変更から T4 GPU を選択しましょう。

プログラムの実行

上から1つずつ▶を押してプログラム実行しましょう。

実行結果

実行すると文字起こし結果が「動画ID.txt」として保存されます。

一括ダウンロード

大量の動画を文字起こしした場合、画面上からはひとつづつしかダウンロードできません。その場合は「+コード」で枠を作成し以下のコードを貼り付けて実行してください。

さいごに

今回は特定のYouTuberの動画をまとめて文字起こしする方法をご紹介しました。

これにより、動画を見返すことなくどこで何を言っていたかがわかるようになりますね!

ぜひご活用ください!!

※参考にさせていただいたサイトです。

コメント