ぞむろぐ

バイクツーリング、鉄道旅行・キャンプ。動画の撮影編集に関する備忘録。主にニコニコ動画で活動中。 所持バイクはホンダのゼルビスとグロム(2018年2月時点)毎週木曜午前12時頃更新(予定)

MENU

ボイスロイドの調声は仮調声→本調声で作業を進めるというお話

ボイスロイドの調声ってこだわり始めると、切りがない。とはいえ、納得いかない状態で上げるのもよろしくない。調声が必要なテキスト量は一文から単語のみの調声すべて含めると、1つの動画で 150~200個くらい。私はそれを仮調声、本調声(呼び方は私なりのもの)で進めています。

 

動画編集ソフトのタイムライン上に音声以外の要素がすべて入った状態から、ボイスロイドを使った音声出力がスタート。タイムライン上に、出力が必要なテキストが入っているので、そこからテキストをボイスロイド上に移し、一度ざっくりした調声を行い、出力。動画編集ソフトに挿入して、字幕の表示時間と音声の再生時間を確認します。

 

テキスト表示と音声再生の時間があっていなない場合は、テキストの表示時間を延ばすか、音声再生時間を短くするなど修正。必要に応じて、テキストの内容を変更していきます。また、タイムライン上の音声の再生タイミングが、前後の音声と近すぎたり、離れすぎたりすることもあるので、そういった箇所も確認と修正をしていくことになります。

 

仮調声の段階では、一文の調声に1~2分(単語の場合はもっと短い)。動画のすべてのテキストの音声ファイルを作成。上記の確認と修正を完了させる。ここでは時間をかけない。できるだけ手早く調声を終わらせます。

 

そのあとに、本調声を実施。動画の最初から音声含めて、チェック。調声が甘い、納得いかないものを再度、ボイスロイドのソフトで調声し直します。といいつつも、大部分は仮調声のままの投稿するケースが多いです。本調声でやり直すのは全体の3割程度。

 

なぜ2段階に調声手順をわけるのか。理由としては、1度動画全体に音声含め、すべての要素を組み込んだ状態で動画全体を俯瞰したいから。音声以外にも確認や修正が必要なこともでてくるでしょう。それも含めて動画の品質を上げるのには、必要なパーツが全部そろってる状態じゃないとできません。

 

現在編集中の動画は、手順を以前のものと変えてみました。時間はかかってますが、その分、多少なりとも動画の質はあがったと感じてます(あくまで主観的なものですけど)。とはいえ、ボイスロイド車載において、ボイスロイドの音声は、動画の重要な要素であることは間違いありません。できれば最後にとことん調声にこだわってから、投稿したい。同時に、アフターエフェクトを使った演出にも時間を割きたい。どこに時間を使うか、今後も検討していく必要があります。

 

調声について、自分以外に人にも色々と意見をもらいたい。それには調声作業をさらすのが、一番わかりやすいかな、と。例えば実際に動画につかった音声の調声作業を、一文のみ切り取って、別途調声作業動画として、投稿する予定です。北海道編の1本目が投稿した後、必要最低限な編集の形で毎週、2~3分の短い動画をYoutubeとニコニコに投稿できたらいいな、と。いやそうしよう。

 

 

f:id:zomuzomu:20191031112143p:plain