「強化学習における報酬関数設計の最適化手法の比較」

2000文字

2023.12.23

関連キーワード
1. 強化学習 2. 報酬関数 3. 最適化手法 4. 比較 5. 強化学習アルゴリズム 6. 教師あり学習 7. モデルベース強化学習 8. モデルフリー強化学習 9. 効率的な報酬関数設計 10. パフォーマンス指標 11. 目的関数 12. 逆強化学習 13. 最適な報酬関数 14. ダイナミックプログラミング 15. モンテカルロ法 16. 確率的動的計画法 17. Q学習 18. サンプル効率 19. オフポリシーメソッド 20. オンポリシーメソッド 21. 確率的最適制御 22. 強化学習の探索と利用のトレードオフ 23. 進化アルゴリズム 24. 進化戦略 25. 遺伝的アルゴリズム 26. 交差エントロピー 27. 逆強化学習 28. ガウス適応 29. ハイパーパラメータ最適化 30. 探索と利用のバランス