- 博客(4)
- 收藏
- 关注
原创 深度强化学习-02(免模型预测、免模型控制)
介绍了使用免模型算法的原因,并详细介绍了解决免模型预测的蒙特卡洛方法、时序差分方法,以及解决免模型控制的Q-learning算法和Sarsa 算法
2023-11-17 17:13:40 103
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
介绍了使用免模型算法的原因,并详细介绍了解决免模型预测的蒙特卡洛方法、时序差分方法,以及解决免模型控制的Q-learning算法和Sarsa 算法
2023-11-17 17:13:40 103
TA创建的收藏夹 TA关注的收藏夹
TA关注的人