キーワード索引
マルチモーダル(Multimodal)
-
P-1-34A本研究では,Vision Language Model (VLM)が人間とどの程度類似した音象徴的感性を持つかを分析する. 実験には,人間の評価に沿って画像を進化させるシステムであるCONRADをベースに,新たにVLMの評価も反映可能な進化型画像生成システムを構築して分析を行った. 実験の結果,VLMは新たに作成した疑似単語を対象にした場合も含め,人間と類似した音象徴的感性を示すことが確認された.