强化学习
wolf_ray
这个作者很懒,什么都没留下…
展开
-
【强化学习笔记】关于一篇对话系统文献综述的读后感
上周导师安排了一个任务——读一下这篇文章 出处:A Survey on Dialogue Systems: Recent Advances and New Frontiers 文章地址: https://arxiv.org/abs/1711.01731v1 作者: Hongshen Chen, Xiaorui Liu, Dawei Yin, Jiliang Tang笔者之前都是搞图原创 2017-11-23 23:10:07 · 3452 阅读 · 5 评论 -
【强化学习笔记】迷宫
【强化学习笔记】迷宫原创 2018-01-31 18:47:21 · 719 阅读 · 0 评论 -
【强化学习笔记】从 “酒鬼回家” 认识Q Learning算法
1.背景现在笔者来讲一个利用Q-learning 方法帮助酒鬼回家的一个小例子, 例子的环境是一个一维世界, 在世界的右边是酒鬼的家。这个酒鬼因为喝多了,根本不记得回家的路,只是根据自己的直觉一会向左走、一会向右走。酒鬼最后只要成功回家, 然后以后就记住了回家的方法, 这就是他用强化学习所学习到的行为。 -w- - - - - H H 是酒鬼的家, w 是酒鬼所处的位置...原创 2018-02-20 00:55:42 · 947 阅读 · 0 评论