(独)産業技術総合研究所は4月27日、市販の歌声合成ソフトで歌唱の音声例と歌詞を吹き込めば、その声の高さと大きさを真似て歌を歌う音声合成技術を開発したと発表した。
同研究所は、この技術を「ボーカリスナー」、略して「ぼかりす」と呼んでいる。通常の市販の歌声合成ソフトで出来るだけ自然な人の歌声を合成しようとすると、楽譜と歌詞を入力後、音の高さ、大きさを何時どのようにするか指定するパラメーター(指標)を長時間かけて調整しなければならなかった。それが「ぼかりす」による自動化で、自分好みの歌い方を音声合成することが誰でも可能になった。
「ぼかりす」の特徴は、[1]音声合成パラメーター推定技術による合成結果の品質向上、[2]歌詞と歌声の高精度な自動対応付け技術、[3]制作者による合成結果の微調整が容易なこと、の3つである。まず[1]によって、まるで発声練習をするみたいに合成音を何度も取り込んで分析、ニュアンスが違った部分のパラメーターを補正、作り直すことで高精度な歌声合成を実現した。これで、異性の声や好きな歌手の声にするのも楽になった。
次いで[2]で、歌詞の各音節の高さを推定して音符化出来るようになったので、楽譜の形で入力しなくても、歌詞テキストに合わせて歌うだけで済むようになった。さらに[3]で、音声調整の専門的知識を持たない人でも、幾つかある候補の中から自分のイメージに近いものを選ぶだけでよい。また、音域を間違えて指定したり、歌唱力が十分でなくても、補正して音声合成する機能も実現した。
同研究所は、「ぼかりす」を産業界と提携して実用化、音声合成を用いた音楽制作の支援や「ぼかりす」を適用できる新応用分野を開拓することにしている。
この技術は、今後の歌声情報処理研究の基本的ツールの一つとなり、「人間らしい歌唱とは何か」、「声の個人性は何に起因するか」などの解明に役立つと見られる。
No.2009-17
2009年4月27日~2009年5月3日