関連キーワード
1. 行動選択
2. 最適化
3. 負の強化
4. 応用
5. 強化学習
6. ニューラルネットワーク
7. マルコフ決定過程
8. パフォーマンス
9. エージェント
10. オプティマル
11. ベルマン方程式
12. 探索と利用のトレードオフ
13. 機械学習
14. 学習アルゴリズム
15. 方策最適化
16. 環境モデル
17. 報酬関数
18. 訓練データ
19. リーズナブル
20. 報酬割引率
21. 行動価値関数
22. 状態価値関数
23. モデルフリー
24. Q学習
25. SARSAアルゴリズム
26. アクションセレクション
27. 動的計画法
28. 近似手法
29. グリーディ法
30. オンライン学習