オルツ、音声とテキスト対応のない素材から音声クローンを生成する技術開発

オルツ、音声とテキスト対応のない素材から音声クローンを生成する技術開発

画像提供:マイナビニュース

パーソナル人工知能P.A.I.『al+オルツ』を開発するオルツは7月25日、音声とテキストの対応の無い素材から音声クローンを生成する技術の開発に成功したと発表した。

今回、同社が開発した技術では、人工知能関連技術を用いることで、これまで個人の音声合成モデルを生成する際に必要だった、特定の音素を取得するための文章の読み上げといった教師素材を事前に準備する必要がなくなり、普段の会話の録音や過去の録音などから音声クローンモデルを生成することができるようになった。

同技術により、わずかな録音からのモデル生成が可能となり、音声クローンの準備段階における利用者の負担が低減されるという。

同社では、同技術により、何らかの理由から文章の読み上げが困難な個人の音声クローンも生成できるため、特に医療分野などでの応用が期待できるとしている。
(辻)

関連記事(外部サイト)