VOICEROIDの調声方法は人によって、色々やり方はあると思いますが、現時点で私がVOICEROID2結月ゆかりで行っている調声の手順について、まとめておきます。あくまで私個人が行っている方法です。また結月ゆかり以外のVOICEROID2や、VOICEROID EXの場合は同様の手順だとうまくいかない可能性があります。
例文:
「結月ゆかりは、超絶美少女である。」
こちらのテキストをサンプルとして、調声を進めます。
マスター・ボイスのパラメータ
まずは現在の「マスター」「ボイス」のパラメータは下記の通り。
■マスター
■ボイス
テキストの分割
まずはテキストを入力して、そのまま再生させてみます。
ある程度は、自動的に文章が文節や単語に分割されます。でも後半の文章の分割位置がおかしい。
ユズキ/ユカリワ/チョーゼツビショージョデ/アル
赤文字の部分が、正しくない位置で分割されています。そこを修正と合わせて、チョーゼツビショージョをさらに切り分けます。ということで、下記のように修正。
必要時おうじて、さらに細かく分割調声することも可能です。でもあまり細かく分割しすぎると、調声作業の手間も増える為、ほどほどにしておきましょう。
アクセントと無声化
次に文節、単語ごとにアクセントと無声化の調声をします。
現在の私のやり方は、単語または文節ごとに先頭の一文字を「無声化しない」。それ以降を「無声化する」。一旦この形にしてから、進めます。
色々試してみて、この方法だと発音がわりと、自然に聞こえる、と考えているからです。ただし、この状態で再生して、聞き取りづらい所を調整していきます。
▼調声に関する参考記事
基本は無声化されている部分を「無声化しない」状態に切り替える。また、無声化しない状態になっている先頭の一文字も、実際に発音させてみて、おかしければ「無声化する」もしくは「無声化を自動でする」に切り替えてみます。
調声したものが上記のものです。ひとまずこの状態で次に進みます。
その前に調声前のものを一度再生してみましょう。
■結月ゆかりは、超絶美少女である(無調声)
音量、話速、高さ、抑揚の調整
このあたりの調整方法は以前と変わりません。実際に自分で発音してみて、その高さや抑揚に合わせて、パラメータの数字を変えていきます。
音量はそのままでも問題ないケースが多いと思います。ですが、文節や単語によって低く聞こえたり、強調したい場合は、上げてみる。逆にトーンを落としたり、抑えたい部分は下げてみましょう。
話速は今回いじっていません。
高さは自分でセリフを発音してみて、高低をつけていきます。フレーズ画面の1.00をベースにして、パラメータを上げていく感じです。
抑揚も高さと同じ方法で調整していきます。発音が不明瞭な文節や単語なども、パラメータを高くした方がいい場合もあります。
全体的にパラメータの数字差が大きくても0.5の範囲内に収まる、極端な差がでない調声になっています。これが正しいというわけでなく、私の好みの調声がこうだということです。キャラ的にはきはき喋らせたいケースなどは、もっと高低差をつけた方がいいかもしれません。
では、いったんここまでの調声で発音させてみましょう。
■結月ゆかりは、超絶美少女である。(スタイル パラメータすべて0)
スタイルのパラメータ設定
この時点でスタイルの数値は全て0です。
私は、スタイルの設定を一番最後に回しています。最初からスタイルの数値をセットしておくことも可能です。それをしないのは、ベースの発音の状態を維持しつつ、高さ、抑揚、話速、音量の設定を行い、スタイルで発音のニュアンスを調整したいと考えているからです。初めからスタイルの数値が設定されていると、途中で変えるのがやりづらいから。基本は0で、必要に応じて、セリフとごとにパラメータを変更します。
試しに、高さ、抑揚、音量を設定した例文にスタイル適用して発音させてみましょう。
■結月ゆかりは、超絶美少女である。(喜び 0.30 怒り 0 悲しみ0)
■結月ゆかりは、超絶美少女である。(喜び 0 怒り 0.30 悲しみ 0)
■結月ゆかりは、超絶美少女である。(喜び 0 怒り 0 悲しみ 0.30)
例文では明確な差がわかりづらいですが、若干言葉のニュアンスが変わっています。
さらにVOICEROIDW2は、スタイルと語尾を組み合わせることで調声することができます。
スタイルの「喜び」は、語尾の「呼びかけ♪」。スタイル「怒り」は、語尾の「断定」に効果があります。
■結月ゆかりは、超絶美少女である。(喜び 0.30 + 呼びかけ♪)
■結月ゆかりは、超絶美少女である。(怒り 0.30 + 断定)
少しだけ語尾が変化しました。でもちょっとわかりづらいですね。スタイルの数値をもう少し上げてもよいかもしれません。元のテキストの高さ、抑揚などと合わせて調節すれば、効果を強められます。
最終的にどういう調声をするかは、最初から決まっていますが、同じセリフでもニュアンスを色々変えることができます。時間があるならば、複数のパターンを調声してみて、一番しっくりくるものを選択できる望ましい。けれども、セリフが多いとそうもいきません。1度色々なパターンを試しておき、実際に作業をするときに、当てはめるパターンを決めておいた方がよいと思います。
注意しなければいけないことが1点。各スタイルの数値をセリフごとに設定しているため、同じセリフを再調声する際、前回のスタイルの数値がわからなくなる事です。もしそれが嫌な場合、喜びならこの数値という風に固定するのも方法の1つです。
最終チェックと修正
調声作業はこれで一通り終了。最後にもう1度確認をする。
あれ、最後の「である」のアクセント、ちょっと違うかもしれない。ということで、修正する。
・修正前
・修正後
実際に発音してみると、ほぼ変わらない。
最後は、自分の感覚頼りでどれを使うか決めることになる。
まとめ
今回紹介したやり方は、あくまで私の手順で、今後も変わっていくものです。他にも色々な調声方法があると思うので、自分で試してみて、やりやすいものを選んでください。
正しいアクセント、聞き取りやすい発音は、個人差がある。自分の感覚に頼ってやる以上、万人に合わせることは難しい。最大公約数的な設定は、おそらくあるんだろうけど。
調声に時間をかければ、よくなる。そうわかっていても、いつまでも時間をかけていられない。こういう作業も、その内AIがぱぱっとやってくるようになったりしないかな。