「正の強化における行動選択の最適化手法の比較と評価」

2000文字

2023.12.26

関連キーワード
1. 正の強化学習 2. 行動選択 3. 最適化手法 4. 比較 5. 評価 6. 強化学習アルゴリズム 7. Q学習 8. SARSA 9. 深層強化学習 10. モデルベース強化学習 11. モデルフリー強化学習 12. 方策勾配法 13. 強化学習環境 14. 行動価値関数 15. 報酬関数 16. 割引率 17. エピソード 18. ベルマン方程式 19. ε-グリーディ法 20. インタラクション 21. 収束性 22. 政策評価 23. 政策改善 24. モンテカルロ法 25. TD学習 26. 探索と利用のトレードオフ 27. 状態空間 28. 行動空間 29. 学習率 30. パラメータチューニング