强化学习
文章平均质量分 95
Hellespontus
我的征途是星辰大海
展开
-
【强化学习】Deep Q Learning
基于上一篇文章的Q Learning和Double Q Learning,讲解了Deep Q Learning,借助深度神经网络让强化学习效果更进一步,解决月球着陆问题。原创 2023-12-19 22:22:55 · 1463 阅读 · 0 评论 -
【强化学习】从蒙特卡洛→SARSA,从Q-Learning→Double Q-Learning
基于上一篇文章内容的蒙特卡洛算法讲解了SARSA,并介绍了Q-Learning和Double Q-Learning,最后使用了SARSA和Double Q-Learning解决了Taxi问题。原创 2023-12-14 00:10:01 · 196 阅读 · 1 评论 -
【强化学习】决策优化问题与Gymnasium环境
区分了什么是强化学习需要解决的决策优化问题,详细解释了各符号在强化学习中所代表的含义,介绍了Gymnasium环境并用蒙特卡洛方法优化了21点问题。原创 2023-11-02 17:25:03 · 235 阅读 · 0 评论