情報処理学会 インタラクション2021

文献情報

タイトル
外国語語彙学習における意味的多様性の高い多義語用例の提示システム
著者
  • 江原 遥(東京学芸大)
アブストラクト
説明画像

外国語学習においては,多くの語を学習する事が必要になる.外国語の語と母語ではそもそもの使い方が異なるため,単純に語とその母語での翻訳を見せるのではなく,母語話者が実際に語を用いた箇所をテキストから抜き出して「用例」として提示することが重要である.さて,学習者が初期に学ぶ語の多くが,複数の異なる意味を持つ多義語である.意味が複数あり,それぞれよく使われる場合は,多様な用例を提示してくれることが望ましい.しかし,個々の用例の意味を人手で付与することはアノテーションコストの面から非現実的である.また,教育の目的では,意味付与を自動で行い学習者に提示するアプローチも,誤りを含む可能性があるため難しい.そこで,本研究では,用例に対して,意味的多様性を考慮した「主要度」を自動付与する手法を提案する.学習者は,主要度の高い順に用例を学ぶだけで,その語の多様な意味を学ぶことができる.提案手法は教師データを必要としないため,様々なドメインや言語に適用できる利点がある.まず,事前学習済言語モデルと転移学習の考え方を用いることで,語の出現(用例)ごとの意味を捉える文脈化単語埋め込みベクトル集合を語ごとに作成する.次に,各用例の文脈化単語埋め込みベクトルが外れ値である度合い(異常度)を計算する事で,各用例がどの程度重要な用例かを計算する.実際に日本語を母語とする英語学習者に対して,英語母語話者により妥当性が確認された多義語の語彙テストを行うことで知る限り初めて第二言語学習者の多義語の語彙知識に関する公開データセットを作成した.評価の結果,有望な結果を得た.

雑誌名
インタラクション2022論文集
© 情報処理学会 2022
論文ID
5P01
ページ
712-717
発行日
2022年2月21日
発行所
発行人 一般社団法人 情報処理学会
住所 〒101-0062 東京都千代田区神田駿河台一丁目5番地 化学会館4F
TEL. 東京 (03) 3518-8374 (代表)
E-mail