「正の強化における学習アルゴリズムの効果的な選択と応用」

2000文字

2024.01.10

関連キーワード
1. 正の強化学習 2. 学習アルゴリズム 3. 効果的な選択 4. 応用 5. 強化学習 6. リワード 7. ポリシー 8. Q値 9. 価値関数 10. オフポリシー学習 11. オンポリシー学習 12. モデルベース学習 13. モデルフリー学習 14. ディープ強化学習 15. 環境モデル 16. エージェント 17. 行動価値関数 18. 決定論的ポリシー 19. モンテカルロ法 20. テンサーフローアルゴリズム 21. ポリシーグラジエント法 22. TD学習 23. 強化学習エージェント 24. 学習能力 25. ベルマン方程式 26. 探索と利用のトレードオフ 27. 利得関数 28. 逆強化学習 29. 複数エージェント強化学習 30. 非マルコフ決定過程