「強化学習における新たなアルゴリズムの提案とその性能評価」

2000文字

2024.02.13

関連キーワード
1. 強化学習 2. アルゴリズム 3. 提案 4. 性能評価 5. モデルベース強化学習 6. モデルフリー強化学習 7. ディープ強化学習 8. Q学習 9. Sarsa 10. 方策勾配法 11. Actor-Critic法 12. モンテカルロ法 13. TD学習 14. ε-greedy法 15. エクスプロレーションとエキスプロイト 16. 強化学習の収束性 17. 利得の最大化 18. グリッドワールド 19. マルコフ決定過程 20. 離散環境 21. 連続環境 22. 近似関数 23. ニューラルネットワーク 24. 教師あり学習 25. 教師なし学習 26. 学習効率 27. パラメータ調整 28. ベルマン方程式 29. 抽象化 30. 広義の強化学習