强化学习
文章平均质量分 74
韬光养晦气
这个作者很懒,什么都没留下…
展开
-
强化学习(RL)
强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。——wiki强化学习在许多学科都有应用,除了AI外,还包括自动化的控制理论,数学中的运筹学和认知科学。在机器学习中,通常可以分为有监督学习(分类,回归),无监督学习(聚类,降维)和强化学...原创 2018-05-10 21:57:28 · 3611 阅读 · 0 评论 -
强化学习与DQN
在Q-learning中很重要的一点,是要去预估未来收益,所以在离散情况下,一般用的是table-based Q-learning算法。它会给出一张表,不断去迭代,直到这张表收敛稳定。当状态空间太大,例如围棋和游戏,就要用深度神经网络。强化学习存在的两点问题:1.信用分配问题(credit assignment problem) 击中砖块并且得分和前一时刻如何移动横杆没有直接关系;前面某一时刻的横...转载 2018-05-23 20:06:32 · 2572 阅读 · 0 评论