2019年9月版 VOICEROID2結月ゆかりの調声手順　例文「結月ゆかりは、超絶美少女である。」

VOICEROIDの調声方法は人によって、色々やり方はあると思いますが、現時点で私がVOICEROID2結月ゆかりで行っている調声の手順について、まとめておきます。あくまで私個人が行っている方法です。また結月ゆかり以外のVOICEROID2や、VOICEROID EXの場合は同様の手順だとうまくいかない可能性があります。

例文：

「結月ゆかりは、超絶美少女である。」

こちらのテキストをサンプルとして、調声を進めます。

マスター・ボイスのパラメータ

まずは現在の「マスター」「ボイス」のパラメータは下記の通り。

■マスター

f:id:zomuzomu:20190919055329p:plain

■ボイス

f:id:zomuzomu:20190919055331p:plain

テキストの分割　

まずはテキストを入力して、そのまま再生させてみます。

f:id:zomuzomu:20190919055615p:plain

ある程度は、自動的に文章が文節や単語に分割されます。でも後半の文章の分割位置がおかしい。

ユズキ／ユカリワ／チョーゼツビショージョデ／アル

赤文字の部分が、正しくない位置で分割されています。そこを修正と合わせて、チョーゼツビショージョをさらに切り分けます。ということで、下記のように修正。

f:id:zomuzomu:20190919060055p:plain

必要時おうじて、さらに細かく分割調声することも可能です。でもあまり細かく分割しすぎると、調声作業の手間も増える為、ほどほどにしておきましょう。

アクセントと無声化

次に文節、単語ごとにアクセントと無声化の調声をします。
現在の私のやり方は、単語または文節ごとに先頭の一文字を「無声化しない」。それ以降を「無声化する」。一旦この形にしてから、進めます。

f:id:zomuzomu:20190919060831p:plain

色々試してみて、この方法だと発音がわりと、自然に聞こえる、と考えているからです。ただし、この状態で再生して、聞き取りづらい所を調整していきます。

▼調声に関する参考記事

www.zomuzomu.com

基本は無声化されている部分を「無声化しない」状態に切り替える。また、無声化しない状態になっている先頭の一文字も、実際に発音させてみて、おかしければ「無声化する」もしくは「無声化を自動でする」に切り替えてみます。

f:id:zomuzomu:20190919061735p:plain

調声したものが上記のものです。ひとまずこの状態で次に進みます。

その前に調声前のものを一度再生してみましょう。

■結月ゆかりは、超絶美少女である（無調声）

音量、話速、高さ、抑揚の調整

このあたりの調整方法は以前と変わりません。実際に自分で発音してみて、その高さや抑揚に合わせて、パラメータの数字を変えていきます。

f:id:zomuzomu:20190919063839p:plain

音量はそのままでも問題ないケースが多いと思います。ですが、文節や単語によって低く聞こえたり、強調したい場合は、上げてみる。逆にトーンを落としたり、抑えたい部分は下げてみましょう。

f:id:zomuzomu:20190919063849p:plain

話速は今回いじっていません。

f:id:zomuzomu:20190919063842p:plain

高さは自分でセリフを発音してみて、高低をつけていきます。フレーズ画面の1.00をベースにして、パラメータを上げていく感じです。

f:id:zomuzomu:20190919063845p:plain

抑揚も高さと同じ方法で調整していきます。発音が不明瞭な文節や単語なども、パラメータを高くした方がいい場合もあります。

全体的にパラメータの数字差が大きくても0.5の範囲内に収まる、極端な差がでない調声になっています。これが正しいというわけでなく、私の好みの調声がこうだということです。キャラ的にはきはき喋らせたいケースなどは、もっと高低差をつけた方がいいかもしれません。

では、いったんここまでの調声で発音させてみましょう。

■結月ゆかりは、超絶美少女である。（スタイル　パラメータすべて0）

スタイルのパラメータ設定

この時点でスタイルの数値は全て0です。

f:id:zomuzomu:20190919070436p:plain

私は、スタイルの設定を一番最後に回しています。最初からスタイルの数値をセットしておくことも可能です。それをしないのは、ベースの発音の状態を維持しつつ、高さ、抑揚、話速、音量の設定を行い、スタイルで発音のニュアンスを調整したいと考えているからです。初めからスタイルの数値が設定されていると、途中で変えるのがやりづらいから。基本は0で、必要に応じて、セリフとごとにパラメータを変更します。

試しに、高さ、抑揚、音量を設定した例文にスタイル適用して発音させてみましょう。

■結月ゆかりは、超絶美少女である。（喜び　0.30　怒り　0　悲しみ0）

■結月ゆかりは、超絶美少女である。（喜び　0　怒り 0.30　悲しみ　0）

■結月ゆかりは、超絶美少女である。（喜び　0　怒り 0　悲しみ　 0.30）

例文では明確な差がわかりづらいですが、若干言葉のニュアンスが変わっています。
さらにVOICEROIDＷ2は、スタイルと語尾を組み合わせることで調声することができます。

スタイルの「喜び」は、語尾の「呼びかけ♪」。スタイル「怒り」は、語尾の「断定」に効果があります。

■結月ゆかりは、超絶美少女である。（喜び　0.30　＋　呼びかけ♪）

■結月ゆかりは、超絶美少女である。（怒り　0.30　＋　断定）

少しだけ語尾が変化しました。でもちょっとわかりづらいですね。スタイルの数値をもう少し上げてもよいかもしれません。元のテキストの高さ、抑揚などと合わせて調節すれば、効果を強められます。

最終的にどういう調声をするかは、最初から決まっていますが、同じセリフでもニュアンスを色々変えることができます。時間があるならば、複数のパターンを調声してみて、一番しっくりくるものを選択できる望ましい。けれども、セリフが多いとそうもいきません。1度色々なパターンを試しておき、実際に作業をするときに、当てはめるパターンを決めておいた方がよいと思います。

注意しなければいけないことが1点。各スタイルの数値をセリフごとに設定しているため、同じセリフを再調声する際、前回のスタイルの数値がわからなくなる事です。もしそれが嫌な場合、喜びならこの数値という風に固定するのも方法の1つです。