情報処理学会 インタラクション2018

文献情報

タイトル
多様な雑音に対して耐性のある声質変換システム
著者
  • 佐藤 邦彦(東大)
  • 暦本 純一(東大/ソニーCSL)
アブストラクト
説明画像

声質変換とは,ある人物の話した音声を,まるで別の人が話したかのように変換することである.声質変換はさまざまなアプリケーションへの応用可能性を秘めており,音声チャットや発話障害者支援,テーマパークの着ぐるみ,カラオケ,VRなど多岐にわたる.しかし,既存の声質変換手法の変換速度はリアルタイム性に欠ける.また,入力音源に雑音が含まれていると期待通りに変換できないという問題がある.本研究では,Deep Neural Network (DNN)を駆使することで,雑音耐性があり,リアルタイム性のより高い声質変換システムを提案する.評価実験の結果,声質変換のDNNを並列処理可能なモデルに改良し,精度を落とさずに学習速度と変換速度を向上させた.また,多様な種類の雑音が含まれた話者音声に対して,雑音を除去せずに声質変換した場合よりも高い精度で声質変換できることがわかった.

雑誌名
インタラクション2018論文集
© 情報処理学会 2018
論文ID
INT18014
ページ
115-124
発行日
2018年2月26日
発行所
発行人 一般社団法人 情報処理学会
住所 〒101-0062 東京都千代田区神田駿河台一丁目5番地 化学会館4F
TEL. 東京 (03) 3518-8374 (代表)
E-mail