ボイスロイドの調声作業の実際の作業をどうやっているかですが、現在は以下の順番でやっています。ただし3~5は順番が前後する場合もあり。
- 文節・音程を整える
- 無声化する、しないの適用
- 抑揚の調整
- 高さの調整
- 話速の調整
- 喜び、怒り、悲しみのスタイル適用 (VOICEROID2のみ)
なぜこの順番になっているかというと、第一に優先するのが聞いていて心地よい音声であること。次に各種パラメータの調整の順番にしています。
1と2は心地よい音声に整える。3~5は聞き取りやすさを整える。6はあまり活用はしていないですが、微調整にパラメータを少しだけいじっています。
マスター側の各パラメータをどう設定しているかは過去記事を参照してください。
1.文節・音程を整える
発音が正しくなるように、文節を適切に区切り、必要な個所にはポーズを挿入します。基本共通語のアクセントに揃えます。実際の作業中は自分で声に出しながら、アクセントの上がる、さがるを確認。
自分の発音がどうかなあ、という時は日本語の発音が確認できるサイトを利用したりも。ただ一般的な文章ならともかく、地方固有のアクセントや読み方などは再現できないので、その辺りは参考程度にしています。
2.無声化する、しないの適用
無声化する、またはしないを適用して、繰り返し発音のチェックを行います。
発音を弱めたい箇所は無声化する、発音を強めたい所はしない。あとは発音が濁っているとか、耳障りだと感じる箇所に1つずつ試していきます。文面によって、だいぶ変わってくるので正直、色々と試しつつ再生を納得できるまで繰り返します。
3.抑揚の調整
自分で声に出すと、文節ごとに強くなる箇所とそうでない箇所があります。それに従って、強くする箇所は抑揚の数字を高くする。それ以外の箇所はデフォルトのままか、もしくはやや下げるといった風に調整します。
抑揚は文節ごとに設定します。デフォルトのまま変更せずにいくことは稀かも。
4.高さの調整
次に高さの調整をします。基本は、抑揚の上げ下げとリンクする形にしています。
5.話速の調整
次に話速の調整。話速をいじると、発音にも影響するので抑揚、高さを再度調整しなおす場合があります。
6.喜び、怒り、悲しみのスタイル適用 (VOICEROID2のみ)
スタイルについては、持て余し気味かもしれません。セリフの感情の起伏に合わせて多少パラメータを~15ほどいじるくらいでしょうか。
実際の調声作業動画
実際のボイスロイド車載用の調声作業を動画にしてみました。解説などはありませんが、実際の作業の様子を見て、何かご意見などあればコメント残してもらえるとうれしいです。
まとめ
調声は手順1~6を繰り返し行うことになります。ひととおり終わったとしても、満足いかなければ、また最初からやり直す。どこまでこだわるかは自分次第です。
私は1つ文章に5分~10分ほど、時間をかけます。できればもっと時間をかけたいところです。でも、そうすると編集がいつまでも終わりません。一定の水準に達したところで一旦終了。出力し、動画に挿入します。すべての作業が終わって投稿までまだ時間が取れる場合に、手直しをすることにしています。