 |
| 2025年7月11日(金):合成音声の音質 |
初音ミクなどのヴォーカルシンセサイザー(ソングボイス)やゆっくりボイスやずんだもんなどのトークボイスの音質って悩みます。
本来は初音ミクも「人間らしさ」を目指して作られたと思うんですが、「ボカロ曲」という合成音声らしさを売りにしたジャンルが定着しました。
トークボイスも、近年はVOICEPEAKやA.I.VOICEといった人間が実際にしゃべっているのと変わらないレベルまで向上したソフトが誕生しつつも、ゆっくりボイスやVOICEROIDといった合成音声らしい声も未だ健在です。
僕は初音ミクの歌声を初めて聴いたときの第一印象が「おお、すごい!でもまだまだかなあ・・・仮歌にはいいかも」という認識でした。
その後、CeVIO AIやSynthesizer V AIの歌声を聴いたとき、「このレベルまで来たのかΣ(゜Д゜)すごい!!」とただただ衝撃を受けました。
なのでソングボイスの方は「人間らしさ」一択なのですが、トークボイスの方はちょっと印象が違いました。
YouTubeで怖い話とか解説系の動画とか観てるのですが、怖い話のナレーションには人間らしさが売りのものより、ゆっくりボイスの方が「無機質な感じがかえって雰囲気をよく醸し出している」と思ったのです。
また、コメディ系の動画においても、VOICEROIDのちょっと棒読み感のある声の方が、なんかおもしろおかしさみたいなものが増しておもしろいんですよね。
合成音声の音質って、どの方向性に向かうのか悩みますねえ。
うまく使い分けていくのがやはり良いのかなと思います。
|
|
|