强化学习
fjy2035
这个作者很懒,什么都没留下…
展开
-
强化学习概览
|更新:2020.12.03 | fjy2035@foxmail.com从今天开始整理强化学习领域的知识,主要参考的资料是Sutton的强化学习书和UCL强化学习的课程。这个系列大概准备写10到20篇,希望写完后自己的强化学习碎片化知识可以得到融会贯通,也希望可以帮到更多的人,毕竟目前系统的讲解强化学习的中文资料不太多。第一篇会从强化学习的基本概念讲起,对应Sutton书的第一章和UCL课程的第一讲。强化学习在机器学习中的位置 强化学习的学习思路和人比较类似,是在实践中学习,比如学习走路转载 2020-12-03 20:45:16 · 200 阅读 · 0 评论 -
强化学习模块基础概念及相关知识
|更新:2020.10.28 | fjy2035@foxmail.com文章目录强化学习:1. 马尔科夫决策(MDP):2. 思想:3. 基本原理:4. 结构:如游戏是环境,人是智能体5. DQN:6. Model-based vs. Model-free:7. on-policy vs. off-policy:其他相关知识1. Multi-task learning vs. Single-task learning2. Multi-objective Optimization vs. Single-原创 2020-10-28 17:51:27 · 741 阅读 · 0 评论 -
Paper: Continuous Deep Q-Learning with Model-based Acceleration
|更新:2020.10.28 | fjy2035@foxmail.com参考博客:1、https://blog.csdn.net/weixin_44125720/article/details/1030986322、https://blog.csdn.net/weixin_42137700/article/details/103255186(Homomorphism-Based RL vs. Latent-Space Modeling)转载 2020-10-28 12:53:07 · 292 阅读 · 0 评论