「即時強化における行動選択の最適化と学習の効率化」

2000文字

2024.01.15

関連キーワード
1. 即時強化学習 2. 行動選択 3. 最適化 4. 学習効率化 5. 強化学習 6. 行動価値関数 7. 行動価値推定 8. モデルベース強化学習 9. モデルフリー強化学習 10. 方策勾配法 11. Q学習 12. SARSA 13. 深層強化学習 14. ニューラルネットワーク 15. 探索と利用のトレードオフ 16. ベルマン方程式 17. 状態価値関数 18. モンテカルロ法 19. TD学習 20. エクスプロレーション 21. エキスプロイト 22. ポリシーグラディエント法 23. モデル予測制御 24. オフポリシーメソッド 25. オンポリシーメソッド 26. ベイズ強化学習 27. ガウス過程 28. 計算効率 29. 収束性 30. 環境モデル化