情報処理学会 インタラクション2026

文献情報

タイトル
口真似音声からの効果音合成技術による音響制作手法の評価
- 音響制作未経験者を対象とした映像への効果音付与 -
著者
  • 滝沢 力(京都産業大学大学院/産業技術総合研究所)
  • 平井 重行(京都産業大学)
  • 須田 仁志(産業技術総合研究所)
アブストラクト
説明画像

人の調音器官(発音能力)を活用し,口真似音声の表現力を用いた効果音合成手法 PronounSEは、コンテンツ制作のための新たな音響合成手法として位置付けできる.この手法は,頭の中の音のイメージをボイスパーカッションのように言語非依存な表現として口で真似て発声し,その音響信号を元に効果音を合成するものである.これまで,爆発音に焦点を当てたデータセットを元にしたモデルを元に,口真似の微細表現の追従性や合成品質の観点で有効性について評価を行ってきたが、コンテンツ制作タスクにおける有用性に関するユーザ評価は未実施であった.そこで,本研究では,無音動画に対して音を付与するタスクにおいて,効果音ライブラリからの音素材選択とPronounSEを用いた音素材制作とで比較実験を行った.音響制作未経験者を対象としたこの評価実験により,PronounSEによる音素材制作の良し悪しが制作者の性別や口真似の巧拙で左右することが確認できた一方で,生成系深層学習技術を用いた音素材を得る行為において,創作性や偶然性が音響制作に寄与することも明らかになった.本論文ではそれらのユーザ評価内容について述べる.

雑誌名
インタラクション2026論文集
© 情報処理学会 2026
論文ID
INT26012
ページ
90-99
発行日
2026年2月20日
発行所
発行人 一般社団法人 情報処理学会
住所 〒101-0062 東京都千代田区神田駿河台一丁目5番地 化学会館4F
TEL. 東京 (03) 3518-8374 (代表)
E-mail