自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (1)
  • 收藏
  • 关注

原创 【原创】Python - 安装opencc ImportError: no module named distribute_setup

当通过pip方式安装opencc时,可能会遇到以下错误:ImportError: No module named distribute_setup。pip install opencc-pythonImportError: No module named distribute_setup我按照文章(https://segmentfault.com/a/1190000010101344)...

2018-09-21 16:19:43 4263 1

翻译 【转译】按行遍历DataFrame

DataFrame.iterrows()for index, row in df.iterrows(): print row["c1"], row["c2"] 

2018-09-18 10:24:51 1719

翻译 【转译】解决python3读取Python2存储的pickle文件

在python3.5处理在python2.7里面存储的序列化文件xxx.pkl会报错。import picklepicklefile=open('python2.pkl','rb')data=pickle.load(picklefile)UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 11: ...

2018-09-14 09:21:50 1337

转载 【转载】利用Python从文件中读取字符串(解决常规乱码问题)

  首先声明这篇学习记录是基于python3的。  python3中,py文件中默认的文件编码就是unicode,不用像python2中那样加u,比如u'中文'。  不过在涉及路径时,比如C:\Users\Administrator\Desktop\StudyNote\Python,还是要加r。  eg:r'C:\Users\Administrator\Desktop\StudyNote\Py...

2018-09-11 15:14:10 824

转载 【转载】Python控制鼠标和键盘-PyAutoGUI

PyAutoGUI是用Python写的一个模块,使用它可以控制鼠标和键盘。利用它可以实现自动化任务,再也不用担心有重复枯燥的任务了。pyautogui模块的功能:移动鼠标、点击左右键和滚轮 发送虚拟按键 # 安装pyautogui这个模块支持Windows, Mac OS X 和 Linux。根据系统不同,你可能需要安装一些依赖。Linux系统(Debian系列):...

2018-09-11 15:06:56 5214

转载 【转载】David Silver公开课9——探索与利用

本文是David Silver强化学习公开课第九课的总结笔记。这一课主要讲了因为存在Exploration和Exploitation矛盾的问题,从而需要考虑如何达到exploration的目的,提出了三种思路。【转载自】chenrudan.github.io本文是David Silver强化学习公开课第九课的总结笔记。这一课主要讲了因为存在Exploration和Exploitation矛...

2018-09-06 10:58:13 372

转载 【转载】David Silver公开课8——Integrating Learning and Planning

Integrating Learning and Planning(对Environment建立模型)本文是David Silver强化学习公开课第八课的总结笔记。这一课主要讲了如何拟合environment模型,通过有监督的方式来更新model,以及如何基于学习的model来找policy/value function,主要谈到了Monte-Carlo Tree Search方法,并且将拟合...

2018-09-06 10:51:22 236

转载 【转载】David Silver公开课7——Policy Gradient

本文是David Silver强化学习公开课第七课的总结笔记。这一课主要讲了将policy看成某个参数hetaheta的函数,即将policy形式变成状态和动作的概率分布函数,在policy函数可微的情况下能够通过对参数求导来优化policy。【转载请注明出处】chenrudan.github.io本文是David Silver强化学习公开课第七课的总结笔记。这一课主要讲了将policy看...

2018-09-06 10:50:10 265

转载 【转载】David Silver公开课6——求解近似值函数

本文是David Silver强化学习公开课第六课的总结笔记。这一课主要讲了由于现实问题中状态数过多导致无法直接求解出值函数,从而通过梯度下降的方式来求解真实值函数的近似函数形式。【转载自】chenrudan.github.io本文是David Silver强化学习公开课第六课的总结笔记。这一课主要讲了由于现实问题中状态数过多导致无法直接求解出值函数,从而通过梯度下降的方式来求解真实值函数...

2018-09-06 10:49:27 370

转载 【转载】David Silver公开课5——Model-Free Control

Model-Free Control(解决未知Environment下的Control问题)本文是David Silver强化学习公开课第五课的总结笔记。这一课主要讲了解决在未知policy未知environment的情况下control问题的两种思路,即On-Policy和Off-Policy,在第四课的Monte-Carlo和Temporal Difference基础上进行改进。【转载...

2018-09-06 10:48:40 227

转载 【转载】David Silver公开课4——Model-Free Learning

Model-Free Learning(解决未知Environment下的Prediction问题)本文是David Silver强化学习公开课第四课的总结笔记。这一课主要讲了解决在未知environment的情况下强化学习的prediction问题的两种方法,分别是Monte-Carlo Reinforcement Learning和Temporal Difference。【转载自】ch...

2018-09-06 10:46:36 301

转载 【转载】David Silver公开课3——动态规划解决MDP的Planning问题

本文是David Silver强化学习公开课第三课的总结笔记。主要谈到了动态规划能够解决MDP的什么问题,能通过Policy Iteration和Value Iteration来解决,这两者指的是什么,出于什么样的考虑提出这两种思路,具体解决步骤是什么。【转载自】chenrudan.github.io本文是David Silver强化学习公开课第三课的总结笔记。主要谈到了动态规划能够解决M...

2018-09-06 10:45:22 432

转载 【转载】David Silver公开课2——马尔可夫决策过程MDP

本文是David Silver强化学习公开课第二课的总结笔记。主要介绍了马尔可夫过程(MP)、马尔可夫奖赏过程(MRP)、马尔可夫决策过程(MDP)是什么,以及它们涉及到的一些概念,结合了课程ppt给出的例子对概念有了一些直观的了解。【转载自】chenrudan.github.io本文是David Silver强化学习公开课第二课的总结笔记。主要介绍了马尔可夫过程(MP)、马尔可夫奖赏过程...

2018-09-06 10:44:26 1157

转载 【转载】David Silver公开课1——强化学习入门

本文是David Silver强化学习公开课第一课的总结笔记。第一课主要解释了强化学习在多领域的体现,主要解决什么问题,与监督学习算法的区别,完整的算法流程由哪几部分组成,其中的agent又包含什么内容,以及解释了强化学习涉及到的一些概念。【转载自】chenrudan.github.io本文是David Silver强化学习公开课第一课的总结笔记。第一课主要解释了强化学习在多领域的体现,主...

2018-09-06 10:42:52 906

转载 【转载】Keras中自定义复杂的loss函数

Keras是一个搭积木式的深度学习框架,用它可以很方便且直观地搭建一些常见的深度学习模型。在tensorflow出来之前,Keras就已经几乎是当时最火的深度学习框架,以theano为后端,而如今Keras已经同时支持四种后端:theano、tensorflow、cntk、mxnet(前三种官方支持,mxnet还没整合到官方中),由此可见Keras的魅力。Keras是很方便,然而这种方便不是没...

2018-09-06 10:37:42 3012

转载 【转载】均方根误差(RMSE),平均绝对误差(MAE),标准差(Standard Deviation)的对比

RMSERoot Mean Square Error,均方根误差 是观测值与真值偏差的平方和与观测次数m比值的平方根。 是用来衡量观测值同真值之间的偏差MAEMean Absolute Error ,平均绝对误差 是绝对误差的平均值 能更好地反映预测值误差的实际情况.标准差Standard Deviation ,标准差 是方差的算数平方根 是用来衡量一组数自身的离散程度...

2018-09-03 08:42:57 2324

VRP车辆路径问题Vehicle Routing Problem.docx

VRP车辆路径问题Vehicle Routing Problem,简单整理的VRP问题基本情况。其中本人较为关注的VRPTW收集了更多的信息,包括网上的DEMO等代码URL。

2020-05-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除