研究分野
自然言語処理
-
P1-005ニュース記事に対する読み手の感情を自動推定するシステムを構築した。はじめにニュース記事の感情指標に関し,40,000記事からなるオリジナルのデータセットを構築した。続いて深層ニューラルネットワークに基づく文脈言語モデルの一種であるRoBERTaを用いて,記事に対する7つの項目(喜び・不安・信頼性・意図性等)の分類課題を行った結果,いずれも予測データと実測データとの強い正の相関となる実用可能な水準に達するモデルを構築した。
-
P1-024単語の意味を分散的に表現する単語ベクトルが四項類推課題を解くことはよく知られているが,そのメカニズムについては必ずしも明らかではない.本研究は,人工的なトイコーパスを用いて,文型や意味関係による言語構造上の制約に加え,文の出現頻度が四項類推課題を解くための平行四辺形の出現条件に関わっていることを示す.また,実コーパスを用いて共起行列の部分空間に平行関係が埋め込まれることを検証し,単語共起自体に内在する自然言語の構造を捉えることを試みる.
-
P2-009A本論文は,機械翻訳が作成する文章において,人間のみが感じる違和感の要因について調査したものである。この研究では,2択の文章選択課題の回答傾向と,「なぜそう答えたか」という回答を分析して要因を検討した。理由の分析では,テキストマイニングを使用し,共 起語ネットワークの評価と対応分析を行なった。これらの結果,文章を読む際に感じる違和感には6つの要因が存在することが示唆された。また,自信度と正答率の間に相関関係はないことが明らかになった。
-
P2-010本稿では,接触回数の増加による会話中の沈黙と話題選択への影響を検討した.日中接触場面と日本語母語場面の初対面の大学生ぺアを対象に,週に1回の自由会話を4週間実施した結果,接触回数の増加によって話題転換時に沈黙が行われる確率に差があるとは言えなかったが,日中接触場面では話題転換時に沈黙が行われる確率が有意に高いという結果が得られた.また,両場面における会話参加者の話題内容にも違いが観察された.
-
P2-028未知の事柄に対する理解を促すには,既に知っている概念と結び付ける類推による説明が有効である.本研究では,特に関連性のある2つの概念を説明対象として,それらを説明するための適切な類推表現を得ることを目指し,類推に用いる既知の概念の抽出を目的とする.類推のための概念抽出には格フレームを用いる.説明対象と共通する格フレームを持つ語を候補群として,使用される頻度を考慮し順位付けを行う.また,提案手法に対して評価実験を行い,その妥当性を検証した.
-
P2-043認知機能の発達を検証する「描画課題」のデータを例に,コーパスなどのテキストから有用な情報を抽出する「テキストマイニング」を適用する手法を本稿では報告する.行動データをPythonライブラリであるscikit-learnに対応した形式に変換すると,コードを簡潔に保ちつつ効率的に分析できる.サンプルコードを公開し,前処理から結果解釈の方法まで述べる.
-
P2-044Jokeを形式意味論的に代表される構成的な意味規定と,伝達意図に支持される非自然的意味規定との境界現象と捉え,そのコミュニケーション機構の分析を行った.Jokeの中心となるpunch lineを明示的に発話しない形式のjokeに着目し,明示的・非明示的な並置が間接言及,参照シフト,交換などの技法の基盤となっていることを主張する.
-
P2-055Aこの論文では, 動的な比喩理解モデルである不定自然変換理論(TINT)で使用するデータとして単語の分散表現を利用できるか検証した。その結果、人と同様の連想イメージを用いた場合と喩辞・被喩辞の連想イメージ間の連想確率を考慮した場合では比喩的な対応づけが生成された.また喩辞・被喩辞間の連想確率がある程度なければモデルが上手く動作しないことがわかった.