キーワード索引

視覚言語モデル(VLM)

  • P-1-34A
    進藤 稜真 (北海道大学 情報科学院)
    飯塚 博幸 (北海道大学 人間知・脳・AI 研究教育センター)
    本研究では,Vision Language Model (VLM)が人間とどの程度類似した音象徴的感性を持つかを分析する. 実験には,人間の評価に沿って画像を進化させるシステムであるCONRADをベースに,新たにVLMの評価も反映可能な進化型画像生成システムを構築して分析を行った. 実験の結果,VLMは新たに作成した疑似単語を対象にした場合も含め,人間と類似した音象徴的感性を示すことが確認された.