机器学习
文章平均质量分 77
蛋烘糕
一个励志将蛋烘糕发展到全球的男子
展开
-
详解LSTM并使用C++实现
由于在评论下面找我要源代码的人太多了,不能够及时回复,所以就上传到网上LSTM源代码,以免大家不能及时获取代码。本文先简单介绍递归神经网络,和LSTM,最后po出用c++代码实现的LSTM。其实我也是在学习中,但是听说最好的学习方法就是学会了再试图给别人讲一遍,所以,here we are我们先举一个晚餐吃什么的例子,看图,由于你是一个强迫症,也就是晚餐吃什么是由昨天吃什么决定的,并且三天...原创 2018-09-12 11:10:56 · 10623 阅读 · 97 评论 -
从零使用强化学习训练AI玩儿游戏(9)——使用DQN(Keras+CNN)
做了这么。。。。。终于到达这一步了。GitHub上源代码上一篇我们用简单的全连接神经网络实现了DQN玩儿了一个简单的游戏,今天我们要用一个复杂的神经网络来玩儿一个复杂的游戏,SpaceInvaders-v0,就玩这个游戏吧,看起来很棒的样子,随便选的。在这个游戏中observaction是一个屏幕RGB的图片,shape是(210,160,3) = 100800个数据正好试一下卷积神经...原创 2018-08-03 12:47:51 · 8528 阅读 · 11 评论 -
从零使用强化学习训练AI玩儿游戏(8)——使用DQN(Keras)
上一篇我们讲了怎么用TensorFlow搭建DQN来玩游戏,这一篇我们使用Keras算法基本上跟上一篇一样,玩的游戏也一样GitHub上源代码这几天,天天找工作面试,终于有点时间把Keras的版本给写了。从TensorFlow换到用Keras搭建的神经网络了,这样就有便于后面我们把神经网络换成CNN加LSTM的操作,因为如果用TensorFlow加这两的话实在是没有Keras方便。首先...原创 2018-07-31 20:21:43 · 5996 阅读 · 2 评论 -
从零使用强化学习训练AI玩儿游戏(4)——使用Sarsa
本文目前主要是写给自己的一个笔记,接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏,如果能间接帮助到他人就最好不过了,不喜勿喷。 上一篇我们已经使用了Q-learning来玩儿一个简单Gym游戏,由于游戏的状态不一定,导致一直更新Q表,所以这个算法在玩儿这种游戏的时候毫无用处,可以玩走迷宫这种。 ...原创 2018-07-07 15:42:57 · 3241 阅读 · 0 评论 -
从零使用强化学习训练AI玩儿游戏(7)——使用DQN(TensorFlow)
上一篇我们使用了DQN来玩简单的走迷宫游戏,但是DQN能胜任比走迷宫游戏更复杂的游戏。这一篇我们就从GYM中选一款游戏来通过训练神经网络,让他自己玩。 我们选择CartPole这款游戏,在之前的Q-learning中我们有用过这款游戏,在Q-learning上效果非常的差。 由于CartPole这个游戏的reward是只要杆子是立起来的,他reward就...原创 2018-07-23 19:51:47 · 6569 阅读 · 2 评论 -
从零使用强化学习训练AI玩儿游戏(6)——使用DQN(TensorFlow)
接上一篇,我们来继续讲讲神经网络DQN的搭建下面是初始化神经网络的函数 def __init__( self, n_actions, # 需要输出多少个action的值,就是控制的动作 如左右 n_features,# 要接受多少个观测状态 learning_rate=0.01,# 学习...原创 2018-07-23 18:50:27 · 7540 阅读 · 4 评论 -
从零使用强化学习训练AI玩儿游戏(5)——使用DQN(TensorFlow)
上一篇我们使用了Sarsa-lambda和Sarsa玩一个寻宝的游戏,这一篇我们要使用DQN(Deep Q Network)来玩儿真正的游戏了,也就是DeepMind前几年用来玩儿电动使得比人类还厉害,然后被谷歌收购的原因之一,想想还有些小激动呐。 还是先po上莫烦大神关于DQN的讲解视频,在这个视频之前你首先的有一点神经网络的知识,和TensorFlow的基础知...原创 2018-07-23 16:43:11 · 10824 阅读 · 7 评论 -
从零使用强化学习训练AI玩儿游戏(3)——使用Q-learning
本文目前主要是写给自己的一个笔记,接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏,如果能间接帮助到他人就最好不过了,不喜勿喷。的...原创 2018-07-05 22:23:15 · 6757 阅读 · 3 评论 -
从零使用强化学习训练AI玩儿游戏(2)——学习Gym
本文目前主要是写给自己的一个笔记,接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏,如果能间接帮助到他人就最好不过了,不喜勿喷。上一篇把玩儿游戏的游戏给搞定了,接下来看看怎么是怎么通过代码来玩儿这个游戏的官网上的doc详细介绍了step函数,如上图所示:step函数返回四个值observation (object): 一个环境特定...原创 2018-07-03 22:14:33 · 8865 阅读 · 2 评论 -
从零使用强化学习训练AI玩儿游戏(1)——安装环境
本文目前主要是写给自己的一个笔记,接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏,如果能间接帮助到他人就最好不过了,不喜勿喷。目前准备使用第一层卷积神经网络,第二层LSTM的方式通过DQN增强学习的方式来训练这个神经网络。我是在Windows7上运行的,做完了会把代码放到GitHub上资源:IDE:PyCha...原创 2018-07-02 19:36:12 · 17221 阅读 · 0 评论 -
scikit-learn MLPRegressor函数出现ConvergenceWarning
ConvergenceWarning: Stochastic Optimizer: Maximum iterations (200) reached and the optimization hasn't converged yet. % self.max_iter, ConvergenceWarning)其实就是迭代了200次但是还是没达到最佳拟合,只需要在创建MLPRegressor的时候加一...原创 2018-04-02 10:07:48 · 13188 阅读 · 2 评论