自分のYouTube動画を海外にも届けたい――そう考えたとき、字幕だけでなく 吹き替え音声 があると視聴体験は大きく変わります。以前はプロのナレーターに依頼するか、自分で外国語を話す必要がありましたが、ElevenLabsのTTS APIの登場で状況が変わりました。
この記事では、私が実際に運用している YouTube動画の多言語吹き替え音声を自動生成するワークフロー を、再現可能な形で紹介します。使うのはClaude、Python、ffmpeg、ElevenLabs API。テキスト処理の中核をClaudeが担い、音声生成と加工をPython + ffmpegが自動化します。特別な機材は不要で、個人クリエイターでも始められます。
Sponsored
目次
Sponsored
ワークフロー全体像
このワークフローは7つのステップで構成されています。
動画ファイル
↓ Step 1: 文字起こし + Python前処理 + Claude整形
日本語テキスト
↓ Step 2: Claudeで翻訳 + TTS最適化
吹き替え用字幕 (_en_dub.srt)
↓ Step 3: ElevenLabs TTS API
cue単位の音声ファイル (.mp3)
↓ Step 4: ffmpegタイムライン構築(★単純連結ではなく絶対時刻配置)
タイムライン音声 (.wav)
↓ Step 5: マスタリング
吹き替え音声 (.mp3)
↓ Step 6: Premiere Proで主音声ミュート + BGM・SE合成
完成版吹き替え音声 (.mp3)
↓ Step 7: アップロード
YouTube Studio(吹き替え音声トラック)
各ステップで使用するツールは以下の通りです。
| ステップ | 使用ツール | 役割 |
|---|---|---|
| Step 1 | Premiere Pro / Whisper + Python + Claude | 文字起こし・前処理・テキスト整形 |
| Step 2 | Claude | 翻訳・吹き替え用字幕作成・TTS最適化 |
| Step 3 | Python + ElevenLabs API | TTS音声生成 |
| Step 4 | ffmpeg | 速度調整・タイムライン配置 |
| Step 5 | ffmpeg | ゲイン調整・リミッタ・MP3出力 |
| Step 6 | Premiere Pro | 主音声ミュート・BGM/SE合成 |
| Step 7 | YouTube Studio | 吹き替え音声の登録 |
Step 1〜2の テキスト処理フェーズ がこのワークフローで最も知的労力がかかる部分で、ここにClaude(LLM)の力が不可欠です。Step 3〜5はスクリプトとffmpegによる自動処理です。
前提環境と事前準備
必要なツール・アカウント
以下のツールとアカウントを事前に用意します。
- Claude(Anthropic)— 翻訳・テキスト最適化の中核ツール
- Python 3.10以上
- ffmpeg / ffprobe(パスが通った状態)
- ElevenLabsアカウント(Starter Plan以上)
- Premiere Pro(文字起こし用、Whisperでも代替可)
- Pythonライブラリ:
requests,python-dotenv、(Whisper使用時はfaster-whisperも)
pip install requests python-dotenv faster-whisper
ElevenLabs APIキーの取得
- ElevenLabsでアカウントを作成
- ダッシュボードの Profile + API Key セクションからAPIキーをコピー
- サイドバーの「ボイス」→「探索」から、言語やカテゴリ(ナレーション、会話的など)でフィルタリングして気に入った音声を見つける
- 音声の詳細画面からVoice IDをコピー
