「連続強化スケジュールにおける報酬の最適化手法の比較」

関連キーワード
1. 連続強化スケジュール 2. 報酬 3. 最適化手法 4. 強化学習 5. マルチエージェントシステム 6. マルチアームバンディット問題 7. モデルフリー手法 8. モデルベース手法 9. 深層強化学習 10. Q学習 11. 行動価値関数 12. 方策最適化 13. 探索と利用のトレードオフ 14. ε-グリーディ手法 15. UCBアルゴリズム 16. 手法の比較 17. 平均報酬の最大化 18. 時間割引率 19. 経験則 20. 状態価値関数 21. SARSAアルゴリズム 22. ベルマン方程式 23. 激務報酬 24. 確率的強化学習 25. 記憶再生 26. エクスプロレーション 27. オプティマルな方策 28. スタークラフトのAI 29. 実験結果 30. パラメータチューニング