学习日记
文章平均质量分 80
senjie_wang
你觉得困难时,不妨向周围人请求帮助,即使他们也许帮不上忙,但没准可以帮你分担压力
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
关于Sklearn的归一化函数MinMaxScalar探讨
关于Sklearn的归一化函数MinMaxScalar探讨引言正文实验一实验二实验二结论 引言 由于目前网上似乎没有博客详细介绍Sklearn的归一化函数MinMaxScalar到底是如何实现数据归一化的,而笔者也不确定生成的scalar的对象能不能完成数据单一映射而对实验结果的精度造成影响,于是有了此篇文章。本文通过生成的格式化数据,对MinMaxScalar函数的处理机制进行了探讨和介绍。通过...原创 2019-12-11 16:46:48 · 5004 阅读 · 4 评论 -
mysql
mysql学习笔记(一) mysql视频学习做的笔记,上传一下,看一下csdn的直接上传md文件编辑排版怎么样。感觉效果还是非常不错的,不过某些字段缩进还是有些问题。 sql的分类 数据查询语言(dql :data query language) 代表关键字:select 数据操作语言(dml:data manipulation language) 代表关键字:insert,delet...原创 2018-08-26 18:01:47 · 319 阅读 · 0 评论 -
用keras搭建DQN
dqn总结: 最近时间虽然一直看这个dqn代码,虽然看懂了,但是思路却一直不明确,无法自己复写出自己的代码,所以就想写一篇博客来整理一下思路。如果这篇文章写完了,应该思路就清晰了。 本文主要是看了莫烦的教学视频,在视频中,老师(尊称一声老师O(∩_∩)O哈哈~)是用tensoflow1.2来搭建框架的。本人在看懂了代码后,认为DQN中采用了两个模型,此时用tensorflow来完成这些网络的灵...原创 2018-09-14 20:33:26 · 9453 阅读 · 12 评论 -
强化学习调试经验(一)
强化学习的调试经验积累 在训练一个强化学习的模型时,特别是这个模型是基于PG算法的时候,我注意到,在构建网络模型时,我们初始化参数会极大的影响整个网络的收敛情况。对于一个policy gradient算法,其网络最后层一般是softmax函数,因此输出的policy是一个不同action下的对应概率分布。可以参考以下代码。 l1 = tf.layers.dense( inputs=self.s,...原创 2019-02-28 20:24:02 · 1635 阅读 · 0 评论 -
tf.app.flags.FLAGS报错解决方法
tf.app.flags.FLAGS报错解决方法 在tensorflow中,tf.app.flags.FLAGS已经转移到tf.flags.FLAGS路径下 以前可以像下面一样直接创建参数并进行赋值 demo_flags=tf.app.flags.FLAGS demo.xxxx=xxxxxxx 更新后需要用函数进行定义之后才能直接赋值,例子如下 demo_flags=tf.flags.FLAGS...原创 2019-06-25 19:59:29 · 5549 阅读 · 7 评论
分享