関連キーワード
1. 行動選択
2. 行動最適化
3. 即時強化
4. 強化学習
5. 最適化手法
6. 価値関数
7. ベルマン方程式
8. 動的計画法
9. モデル予測制御
10. モンテカルロ法
11. TD学習
12. Q学習
13. SARSAアルゴリズム
14. 状態空間
15. 行動空間
16. 報酬関数
17. 学習率
18. 探索と利用のトレードオフ
19. 出力関数
20. アクション価値関数
21. 経験再生
22. 深層強化学習
23. 人工ニューラルネットワーク
24. 勾配法
25. 確率モデル
26. 環境モデル
27. エージェント
28. ベーシック強化学習手法
29. インセンティブを与える
30. 出力の改善