日本認知科学会第41回大会

キーワード索引

視覚言語モデル(VLM)

P-1-34A

進化型画像生成システムを用いた視覚言語モデルの音象徴的感性に関する分析

進藤稜真 (北海道大学情報科学院)

飯塚博幸 (北海道大学人間知・脳・AI 研究教育センター)

本研究では,Vision Language Model (VLM)が人間とどの程度類似した音象徴的感性を持つかを分析する. 実験には,人間の評価に沿って画像を進化させるシステムであるCONRADをベースに,新たにVLMの評価も反映可能な進化型画像生成システムを構築して分析を行った. 実験の結果,VLMは新たに作成した疑似単語を対象にした場合も含め,人間と類似した音象徴的感性を示すことが確認された.