增强学习
文章平均质量分 91
最后一个萨满
又红又正!
展开
-
[增强学习][Reinforcement Learning]学习笔记与回顾-2-马尔可夫决策过程MDP
Markov Decision Processes前言本文主要是视频学习的总结与回顾,想要了解更多内容请看视频或者学习专业课程。这一节主要是说马尔可夫决策过程-Markov Decision Processes,也成MDP。 在了解MDP之前,如果大家了解过马尔可夫链(markov chain),或者机器学习中的隐马尔可夫过程,那么对于马尔可夫性就会有一定了解,即无后效性。Introduction原创 2017-05-24 20:26:53 · 3731 阅读 · 0 评论 -
[增强学习][Reinforcement Learning]学习笔记与回顾-1
引言增强学习这几篇博客在于学习增强学习中所获得知识的理解与回顾,如果想要深入学习增强学习,请参考后文所列出的资料和书籍。本文只用于复习与理解。Introduction to Reinforcement Learning1.领域交叉这张图详尽的描述了增强学习与各个领域的交集,可以很多领域都涉及增强学习过程,自认为RL可能是科学这个空间里最接近强人工智能的一项,看到训练出的AI完成游戏的过程,就像是训练原创 2017-05-18 12:55:50 · 3052 阅读 · 0 评论