「強化学習における報酬関数の設計と最適化」

全文を見たい方は記事下の『このレポートを購入』からご購入ください!
購入後すぐに全文が閲覧できます。1分でわかる購入方法はこちら

関連キーワード
1. 強化学習 2. 報酬関数 3. 設計 4. 最適化 5. マルコフ決定過程 6. ベルマン方程式 7. 勾配法 8. Q関数 9. 方策 10. 強化学習アルゴリズム 11. 関数近似 12. 逆強化学習 13. 状態価値関数 14. エピソード 15. 行動価値関数 16. 収束性 17. 目的関数 18. モデルフリー 19. モデルベース 20. 強化学習の応用 21. エキスプロレーション 22. フォワードモデル 23. チューニングパラメータ 24. オフポリシーメソッド 25. オンポリシーメソッド 26. 交差エントロピー誤差 27. 報酬割引率 28. 強化学習の収束性の分析 29. 強化学習の収束アルゴリズム 30. ベルマン最適方程式

タイトルとURLをコピーしました