TOP
プログラム
論文集
申し込み
アクセス・マップ
問い合わせ
キーワード索引
満足化
P-3
-15
強化学習の社会性:バンディット問題と目標設定理論
高橋 達二
(東京電機大学)
不確実性の下の環境探索と適切な行動の学習に関し、従来は最も適切な (環境から得られる報酬を最大化) 行動の獲得が評価される。しかし実世界課題では多くの場合、単位を取る (60点以上獲得)、黒字化する (損益を0以上に) などの目標の達成との関係で行動が評価される。そこで、バンディット問題において目標設定理論の予測 (具体的で高い目標がパフォーマンスを向上させる) が正しいかどうかを検証する。結果は、目標設定理論を弱く支持した。
Menu
論文集全体
日程
10月12日 (木)
10月13日 (金)
10月14日 (土)
著者・企画関係者
研究分野
キーワード索引
協賛企業(先着順)