🔊 動画音声変換

動画を別言語の音声に自動変換

動画URLを貼り付けるか、ファイルをアップロードするだけ。Dokitscriptが文字起こし・翻訳・AI音声生成を一括処理して、ダウンロードできるMP3を作ります。ElevenLabs搭載。

TikTok · Instagram · YouTube · Facebook · X · LinkedIn · 2026年6月更新

今すぐ動画音声変換を試す →
初回は登録不要  ·  音声生成にはStarterプランが必要

動画を別言語の音声に変換するにはどうすればいいですか? 動画URLをDokitscriptに貼り付けるか、ファイルをアップロードし、文字起こしが完了したらAI翻訳機能で目的の言語に翻訳して「聴く」をクリックします。ElevenLabsのeleven_multilingual_v2モデルが翻訳テキストを自然な音声で読み上げ、128 kbpsのMP3としてダウンロードできます。文字起こしはOpenAI Whisperで行われ90言語以上に対応しています。音声生成は約29言語に対応しており、Starterプラン以上が必要です。

動画を音声に変換する4ステップ

ソフトのインストール不要。すべてブラウザで完結します。

1

URLを貼り付けるかファイルをアップロード

TikTok・Instagram・YouTube・Facebook・X・LinkedInの動画URLを貼り付けるか、音声・動画ファイル(最大50MB)をアップロードします。

2

OpenAI Whisperで文字起こし

Dokitscriptが動画の音声を90言語以上で文字起こしします。話されている言語は自動検出され、手動で指定することもできます。

3

目的の言語に翻訳

AI翻訳機能で、文字起こしテキストを日本語・英語・スペイン語・フランス語など対応言語に翻訳します。

4

「聴く」をクリックしてMP3をダウンロード

ElevenLabsが翻訳テキストを自然なAI音声で読み上げます。128 kbpsのMP3ファイルとしてダウンロードできます。

動画音声変換に含まれる機能

URLからMP3まで、すべてひとつのツールで。

🎙️

ElevenLabsによる自然なAI音声

ElevenLabsのeleven_multilingual_v2モデルで音声を生成。現在入手可能な最も自然な多言語AI音声のひとつです。

🌍

90言語以上の文字起こし

OpenAI Whisperが音声をテキストに変換。話されている言語を自動検出し、90言語以上の文字起こしに対応しています。

🔤

AI翻訳が内蔵

翻訳ステップはClaude AIで処理。音声に変換する前に、自然な翻訳テキストが生成されます。

⬇️

128 kbpsのMP3ダウンロード

出力はMP3ファイルとしてダウンロード可能。ポッドキャスト・動画編集・語学学習・アクセシビリティ用途に活用できます。

🔗

主要プラットフォームすべてに対応

TikTok・Instagram Reels・YouTube Shorts・YouTube・Facebook・X(旧Twitter)・LinkedINのURLに対応。ローカルファイルのアップロードも可能です。

📝

テキスト文字起こしも同時取得

MP3とあわせて、文字起こしテキストと翻訳テキストも取得できます。TXT・SRT形式でのエクスポートにも対応しています。

AI音声生成はどの言語に対応していますか?

文字起こしと音声生成では対応言語数が異なります。正直な比較をご覧ください。

文字起こし — 90言語以上(OpenAI Whisper)

日本語・英語・フランス語・スペイン語・アラビア語・中国語・ヒンディー語・韓国語・ポルトガル語・ドイツ語・イタリア語など90言語以上で文字起こしが可能。話されている言語は自動検出されます。

AI音声生成 — 約29言語(ElevenLabs)

MP3音声出力はElevenLabsが担当し、現在約29言語に対応しています:

日本語 英語 フランス語 スペイン語 ドイツ語 イタリア語 ポルトガル語 ポーランド語 トルコ語 ロシア語 オランダ語 チェコ語 アラビア語 中国語 韓国語 ヒンディー語 インドネシア語 フィリピン語 スウェーデン語 ブルガリア語 ルーマニア語 ギリシャ語 フィンランド語 クロアチア語 スロバキア語 デンマーク語 タミル語 ウクライナ語

注:文字起こしは90言語以上に対応していますが、音声生成の対応言語は約29言語です。対象言語がリストにない場合でも、翻訳テキストは取得できます。

動画音声変換はどんな人が使いますか?

別言語のオーディエンスに音声コンテンツを届けたいあらゆる場面で活躍します。

コンテンツの多言語展開

TikTokやInstagram Reelsを別言語のナレーション音声に変換。再録音なしで海外オーディエンスにリーチしたいクリエイターに最適です。

語学学習

外国語動画を文字起こしして翻訳し、MP3として聴いてリスニング力を鍛えましょう。実際のコンテンツで学びたい学習者に役立ちます。

アクセシビリティ向上

記事や文字起こしを音声ファイルに変換して、視覚に障害のある方や移動中に耳で情報収集したい方に届けられます。

ポッドキャスト制作

エピソードを別言語に翻訳してナレーション音声を生成。海外リスナー向けのボーナスエピソードとして配信できます。

研修・教育コンテンツ

録音した授業や社内研修動画を複数言語の音声ファイルに変換して、各国のチームメンバーに配布できます。

ナレーション下書き

声優を起用する前の仮ナレーションとしてAI音声MP3を使用。動画制作の初期段階で時間を節約できます。

動画音声変換でできないこと: 元の動画ファイルへの音声差し込みや吹き替え、口の動きとのリップシンク同期、元話者の声のクローニング、複数のAI音声からの選択はできません。出力は独立したMP3音声ファイル(ナレーション)であり、吹き替え済み動画ではありません。

月に何分の音声生成が使えますか?

文字起こしと翻訳はすべてのプランで利用可能。音声生成にはStarterプラン以上が必要です。

プラン 料金 文字起こし 動画の最大長 音声生成(MP3)
無料 $0 月5回 3分 利用不可
Starter $4.99 / 月 月200回 8分 月6分
Pro $14.99 / 月 無制限 45分 月60分
Business $79.99 / 月 無制限 5時間 月240分

音声分数は生成したMP3ごとに消費されます。未使用分は翌月に繰り越されません。料金の詳細を見る →

動画音声変換 — よくある質問

動画URLをDokitscriptに貼り付けるか、ファイルをアップロードし、文字起こしが完了したらAI翻訳機能で目的の言語に翻訳して「聴く」をクリックします。ElevenLabsのAI音声エンジンが自然な音声のMP3を生成し、ダウンロードできます。全工程で数分程度かかります。
TikTok・Instagram Reels・YouTube(Shorts含む)・Facebook・X(旧Twitter)・LinkedInのURLに対応しています。ローカルの音声・動画ファイル(MP3・WAV・M4A・MP4・WebM、最大50MB)のアップロードも可能です。
文字起こしはOpenAI Whisperで90言語以上に対応しています。AI音声生成(MP3出力)はElevenLabs eleven_multilingual_v2を使用し、日本語・英語・フランス語・スペイン語・ドイツ語・イタリア語・ポルトガル語・ポーランド語・トルコ語・ロシア語・オランダ語・チェコ語・アラビア語・中国語・韓国語・ヒンディー語・インドネシア語・フィリピン語・スウェーデン語・ブルガリア語・ルーマニア語・ギリシャ語・フィンランド語・クロアチア語・スロバキア語・デンマーク語・タミル語・ウクライナ語など約29言語に対応しています。
ダウンロードされるMP3ファイルは128 kbpsでエンコードされており、ナレーション・ポッドキャスト・語学学習・アクセシビリティ用途に適した品質です。
いいえ。現在の機能は翻訳テキストを読み上げる独立したMP3音声ファイルを生成するものです。元の動画に音声を合成したり、口の動きに同期したり、元話者の声をクローンしたり、複数の音声から選んだりすることはできません。出力はナレーション音声ファイルであり、吹き替え動画ではありません。
音声生成にはStarterプラン以上が必要です。無料プランでは文字起こしとAIテキスト翻訳が利用できますが、MP3音声出力は含まれません。Starterプランは月6分、Proプランは月60分、Businessプランは月240分の音声生成が含まれます。
AI文字起こしは音声をテキストに変換します。動画音声変換はさらに一歩進み、動画を文字起こしして別言語に翻訳し、その翻訳テキストを音声(MP3ファイル)に変換します。音声→テキスト→音声の流れに、翻訳ステップが加わった処理です。
はい。無料プランで文字起こしと翻訳が利用できます(月5回の文字起こし・月3回のAI翻訳)。MP3音声生成にはStarterプラン以上が必要で、月額$4.99からご利用いただけます。

Dokitscriptのその他の機能

今すぐ動画を音声に変換しよう

無料でスタート。音声生成は月額$4.99から。ソフトのインストール不要。

無料で始める →