ぞむろぐ

バイクツーリング、鉄道旅行・キャンプ。動画の撮影編集に関する備忘録。主にニコニコ動画で活動中。 所持バイクはホンダのゼルビスとグロム(2018年2月時点)毎週木曜午前12時頃更新(予定)

MENU

2019年9月版 VOICEROID2結月ゆかりの調声手順 例文「結月ゆかりは、超絶美少女である。」

 

VOICEROIDの調声方法は人によって、色々やり方はあると思いますが、現時点で私がVOICEROID2結月ゆかりで行っている調声の手順について、まとめておきます。あくまで私個人が行っている方法です。また結月ゆかり以外のVOICEROID2や、VOICEROID EXの場合は同様の手順だとうまくいかない可能性があります。

 

例文:

「結月ゆかりは、超絶美少女である。」

 

こちらのテキストをサンプルとして、調声を進めます。

 

マスター・ボイスのパラメータ

 

まずは現在の「マスター」「ボイス」のパラメータは下記の通り。

 

■マスター

f:id:zomuzomu:20190919055329p:plain

■ボイス

f:id:zomuzomu:20190919055331p:plain

 

テキストの分割 

 

まずはテキストを入力して、そのまま再生させてみます。

f:id:zomuzomu:20190919055615p:plain

ある程度は、自動的に文章が文節や単語に分割されます。でも後半の文章の分割位置がおかしい。

 

ユズキ/ユカリワ/チョーゼツビショージョデ/アル

 

赤文字の部分が、正しくない位置で分割されています。そこを修正と合わせて、チョーゼツビショージョをさらに切り分けます。ということで、下記のように修正。

 

f:id:zomuzomu:20190919060055p:plain

必要時おうじて、さらに細かく分割調声することも可能です。でもあまり細かく分割しすぎると、調声作業の手間も増える為、ほどほどにしておきましょう。


アクセントと無声化

 

次に文節、単語ごとにアクセントと無声化の調声をします。
現在の私のやり方は、単語または文節ごとに先頭の一文字を「無声化しない」。それ以降を「無声化する」。一旦この形にしてから、進めます。

 

f:id:zomuzomu:20190919060831p:plain

 

色々試してみて、この方法だと発音がわりと、自然に聞こえる、と考えているからです。ただし、この状態で再生して、聞き取りづらい所を調整していきます。

 

 ▼調声に関する参考記事

www.zomuzomu.com

 


基本は無声化されている部分を「無声化しない」状態に切り替える。また、無声化しない状態になっている先頭の一文字も、実際に発音させてみて、おかしければ「無声化する」もしくは「無声化を自動でする」に切り替えてみます。

 

f:id:zomuzomu:20190919061735p:plain

 

調声したものが上記のものです。ひとまずこの状態で次に進みます。

その前に調声前のものを一度再生してみましょう。

 

■結月ゆかりは、超絶美少女である(無調声)

 

 

 

音量、話速、高さ、抑揚の調整

 

このあたりの調整方法は以前と変わりません。実際に自分で発音してみて、その高さや抑揚に合わせて、パラメータの数字を変えていきます。

 

f:id:zomuzomu:20190919063839p:plain

音量はそのままでも問題ないケースが多いと思います。ですが、文節や単語によって低く聞こえたり、強調したい場合は、上げてみる。逆にトーンを落としたり、抑えたい部分は下げてみましょう。

 

f:id:zomuzomu:20190919063849p:plain

話速は今回いじっていません。

 

f:id:zomuzomu:20190919063842p:plain

高さは自分でセリフを発音してみて、高低をつけていきます。フレーズ画面の1.00をベースにして、パラメータを上げていく感じです。

 

 

f:id:zomuzomu:20190919063845p:plain

抑揚も高さと同じ方法で調整していきます。発音が不明瞭な文節や単語なども、パラメータを高くした方がいい場合もあります。

 

全体的にパラメータの数字差が大きくても0.5の範囲内に収まる、極端な差がでない調声になっています。これが正しいというわけでなく、私の好みの調声がこうだということです。キャラ的にはきはき喋らせたいケースなどは、もっと高低差をつけた方がいいかもしれません。

 

では、いったんここまでの調声で発音させてみましょう。

 

■結月ゆかりは、超絶美少女である。(スタイル パラメータすべて0)

 

スタイルのパラメータ設定

 

この時点でスタイルの数値は全て0です。

 

f:id:zomuzomu:20190919070436p:plain

私は、スタイルの設定を一番最後に回しています。最初からスタイルの数値をセットしておくことも可能です。それをしないのは、ベースの発音の状態を維持しつつ、高さ、抑揚、話速、音量の設定を行い、スタイルで発音のニュアンスを調整したいと考えているからです。初めからスタイルの数値が設定されていると、途中で変えるのがやりづらいから。基本は0で、必要に応じて、セリフとごとにパラメータを変更します。

 

試しに、高さ、抑揚、音量を設定した例文にスタイル適用して発音させてみましょう。

 

■結月ゆかりは、超絶美少女である。(喜び 0.30 怒り 0 悲しみ0)

 

■結月ゆかりは、超絶美少女である。(喜び 0 怒り 0.30 悲しみ 0)

 

■結月ゆかりは、超絶美少女である。(喜び 0 怒り 0 悲しみ  0.30

 

例文では明確な差がわかりづらいですが、若干言葉のニュアンスが変わっています。
さらにVOICEROIDW2は、スタイルと語尾を組み合わせることで調声することができます。

 

スタイルの「喜び」は、語尾の「呼びかけ♪」。スタイル「怒り」は、語尾の「断定」に効果があります。

 

■結月ゆかりは、超絶美少女である。(喜び 0.30 + 呼びかけ♪)

 

■結月ゆかりは、超絶美少女である。(怒り 0.30 + 断定)

 

少しだけ語尾が変化しました。でもちょっとわかりづらいですね。スタイルの数値をもう少し上げてもよいかもしれません。元のテキストの高さ、抑揚などと合わせて調節すれば、効果を強められます。

 

最終的にどういう調声をするかは、最初から決まっていますが、同じセリフでもニュアンスを色々変えることができます。時間があるならば、複数のパターンを調声してみて、一番しっくりくるものを選択できる望ましい。けれども、セリフが多いとそうもいきません。1度色々なパターンを試しておき、実際に作業をするときに、当てはめるパターンを決めておいた方がよいと思います。 

 

注意しなければいけないことが1点。各スタイルの数値をセリフごとに設定しているため、同じセリフを再調声する際、前回のスタイルの数値がわからなくなる事です。もしそれが嫌な場合、喜びならこの数値という風に固定するのも方法の1つです。

 

最終チェックと修正

 

調声作業はこれで一通り終了。最後にもう1度確認をする。

あれ、最後の「である」のアクセント、ちょっと違うかもしれない。ということで、修正する。

 

・修正前

f:id:zomuzomu:20190919103315p:plain

・修正後

f:id:zomuzomu:20190919103313p:plain

実際に発音してみると、ほぼ変わらない。

 

最後は、自分の感覚頼りでどれを使うか決めることになる。

 

 

まとめ

 

今回紹介したやり方は、あくまで私の手順で、今後も変わっていくものです。他にも色々な調声方法があると思うので、自分で試してみて、やりやすいものを選んでください。

正しいアクセント、聞き取りやすい発音は、個人差がある。自分の感覚に頼ってやる以上、万人に合わせることは難しい。最大公約数的な設定は、おそらくあるんだろうけど。

調声に時間をかければ、よくなる。そうわかっていても、いつまでも時間をかけていられない。こういう作業も、その内AIがぱぱっとやってくるようになったりしないかな。

 

f:id:zomuzomu:20190919093430p:plain