ぞむろぐ

バイクツーリング、鉄道旅行・キャンプ。動画の撮影編集に関する備忘録。主にニコニコ動画で活動中。 所持バイクはホンダのゼルビスとグロム(2018年2月時点)毎週木曜午前12時頃更新(予定)

MENU

ボイスロイド車載動画1本の音声ファイル数と作業時間

車載動画に限らず、ボイスロイドを使った動画を作るなら、当然ボイスロイドで音声を作る必要がある。じゃあ、動画1本を作るならどれくらいの音声ファイルが必要になるのか。これは、作る人によって、まちまちではある。動画の尺、音声の速度、セリフの密度。様々な条件で変わってくます。

 

私の場合は、編集前に台本を作成するようにしているので、過去に投稿した動画と、その際の作業時間を鑑みて、下記のように考えています。

 

1動画における調声作業時間合計=セリフ数×5分

 

 

 

 

投稿している動画に使用する音声ファイル数

 

ひとまず自分が投稿した動画の数字をざっくり並べてみると、下記の通り。なお、下記の数字は、コメント返しが含まれるニコニコ動画を基準とする。また複数のボイスロイドを使用している場合、ファイル数は合算しています。

 

■直近の動画

  • 本州最西端編1 動画再生時間 約11分 音声ファイル数 80
  • 本州最西端編2 動画再生時間 約12分 音声ファイル数 111
  • 本州最西端編3 動画再生時間 約12分 音声ファイル数 88
  • 本州最西端編4 動画再生時間 約10分 音声ファイル数 89
  • 大洗編1    動画再生時間 約10分 音声ファイル数 147
  • 大洗編2    動画再生時間 約10分 音声ファイル数 136
  • 北海道編1   動画再生時間 約16分 音声ファイル数 180
  • 北海道編1   動画再生時間 約20分 音声ファイル数 205

 

ざっくりですが1分辺り、ファイル(セリフ)数が10個程度。セリフ数がわかれば、編集前でも動画の再生時間がどれくらいになりそうか、目途がつきますね。

 

 

1ファイルの調声作業時間

 

1ファイル・1テキストの調声作業時間は、私の場合は5分

 

1つのファイルでも、「あっ」とか「ふーん」とか。1文字くらいのものや、15文字くらいのものもあります。基本的に1画面に1度に表示できるセリフ。極端に長いテキストはありません。説明文や回想で、長々と朗読するシーンは、私の動画の場合ほぼありません。

 

1つのファイルのテキスト調声は、最大15文字くらい。調声時間は、長く見積もって、1ファイル5分。テキストの内容を修正しつつ、作業することもありますが、おおよそそれくらい。

 

たまに調声にこだわって1つのテキストに30分くらいかけることもありますが、それはまれなケース。

 

 

台本作成時点で、調声作業時間の把握

 

以前は、動画の再生時間を10分など、固定していました。なので、動画の再生時間で調声時間を調節していました。

 

現在は動画編集に取り掛かる前に台本を作るようになりました。おかげで、事前にある程度調声するセリフ数がわかっています。セリフ数がわかれば、調声作業にかかる時間がわかります。

 

現在投稿中の北海道編は、1動画辺りのセリフ数が180~200くらい。調声に必要な時間は最大で1000分、16時間半。1日2時間作業して、1週間以上。結構時間とられてますね。もし、作業時間が長くなりすぎるなら、セリフの数を減らして、調節が必要かもしれません。

 

 

 まとめ

 

ボイスロイドの調声は、とても時間がかかる作業です。私の編集だと音声出力は、最後に近い工程なので、把握しておくと、完成時期の目途が立ちます。投稿するタイミングが決まっているなら、編集にかけられる時間もわかる。先が見えないより、完成までの道のりがわかっていた方が、だれにくいと思います。どこまでこだわるかは、進捗を見つつ、やっていこうかと。

 

f:id:zomuzomu:20200116103145p:plain