キーワード索引

深層強化学習

  • P-107
    西村 宏武 (京都工芸繊維大学)
    岡 夏樹 (京都工芸繊維大学)
    田中 一晶 (京都工芸繊維大学)
    我々は人の社会的行動のメカニズムを構成的に解明することを目指している。本研究では、マルチエージェント鬼ごっこ環境における鬼側の深層強化学習エージェントの追いかけ動作と、人の追いかけ動作を比較した。移動エントロピーを指標として両者の間の相違点を検討したところ、興味深い違いが見つかった。今後はこの差異の原因を明らかにし、エージェントを人に近づけていくため、エージェントの設計仕様や差異の評価指標を再検討する。