强化学习
平行的空间
这个作者很懒,什么都没留下…
展开
-
项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(三)
这个项目用三篇文章进行介绍,各部分的内容如下:项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(一):总体介绍,游戏部分项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(二):算法部分项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(三):算法和游戏的交互部分,模型训练,模型评估,使用相同的算法和参数去玩另外一个不...原创 2019-10-14 19:06:19 · 987 阅读 · 0 评论 -
项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(二)
这个项目用三篇文章进行介绍,各部分的内容如下:项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(一):总体介绍,游戏部分项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(二):算法部分项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(三):算法和游戏的交互部分,模型训练,模型评估,使用相同的算法和参数去玩另外一个不...原创 2019-10-14 15:15:07 · 1156 阅读 · 0 评论 -
项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(一)
这个项目用三篇文章进行介绍,各部分的内容如下:项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(一):总体介绍,游戏部分项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(二):算法部分项目实战:使用Deep Q Network(DQN)算法让机器学习玩游戏(三):算法和游戏的交互部分,模型训练,模型评估,使用相同的算法和参数去玩另外一个不...原创 2019-10-14 12:05:13 · 1854 阅读 · 0 评论 -
强化学习(一):基础知识
强化学习是什么我们先通过图一的三种方法的对比来看看强化学习和其他方法的差异是什么:图一.各种学习算法有监督学习(supervised learning):它的数据都是有标签y的。比如手写数字分类问题中,输入的是手写数字的图片,标签就是这个图片属于的类别,比如所有数字0的类别是0,这样手写数字集会有10个类别,0-9就是它的标签。有监督学习的目标就是对于输入数据x,预测出它所属...原创 2019-08-07 06:03:20 · 3032 阅读 · 2 评论 -
强化学习(二):Q learning 算法
强化学习(一):基础知识强化学习(二):Q learning算法Q learning 算法是一种value-based的强化学习算法,Q是quality的缩写,Q函数 Q(state,action)表示在状态state下执行动作action的quality, 也就是能获得的Q value是多少。算法的目标是最大化Q值,通过在状态state下所有可能的动作中选择最好的动作来达到最大化期望re...原创 2019-08-13 00:21:39 · 23855 阅读 · 3 评论 -
强化学习(三):Deep Q Network(DQN)算法
强化学习(一):基础知识强化学习(二):Q learning算法强化学习(三):Deep Q Network(DQN)算法在上一节中介绍的Q learnig算法利用Q table来记录和检索 Q value,在状态空间较小的情况下可以适用,但是当状态空间很大的时候,利用Q table来维护数据就不太可行了,所以就诞生了deep Q network(DQN)算法,也叫deep Q lea...原创 2019-08-13 23:02:33 · 4623 阅读 · 0 评论