增强学习
文章平均质量分 63
tianguiyuyu
这个作者很懒,什么都没留下…
展开
-
增强学习简介
机器学习有三大分支,监督学习、无监督学习和强化学习,强化学习是系统从环境学习以使得奖励最大的机器学习。人工智能中称之为强化学习,在控制论中被称之为动态规划,两者在概念上是等价的。也被翻译为增强学习。二、概念1.不同于机器学习的其它两个分支:它不是无监督学习,因为有回报(Reward)信号反馈是延时的,而不是即时的数据是与时间有关的序列智能体的动作与后续的数据有关2.强化学习基于一种回报假设:回报是...原创 2018-05-27 20:05:33 · 1250 阅读 · 0 评论 -
增强学习之q_learning
Q-learning的算法思想如下: code as follows if you are interested in it.""" '---------T' our environment A simple example for Reinforcement Learning using table lookup Q-learning method. An agent "o" is on the...原创 2018-05-27 20:09:40 · 666 阅读 · 0 评论