自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

xl.zhang的博客

海阔任鱼跃,天高任鸟飞。

  • 博客(3)
  • 资源 (32)
  • 收藏
  • 关注

转载 David Silver强化学习公开课(七):策略梯度

前一讲主要讲解的是价值函数的近似,然后根据价值函数来制定策略。本讲中策略P(a|s)将从一个概率集合摇身变成函数本身π(s,a),通过借助策略相关的目标函数梯度的引导,寻找与目标函数的极值,进而得到最优策略。本讲组织架构如下:先提出价值函数在某些情况下不能很好的解决问题,同时直接基于策略的分析在某些场合具有价值函数不能替代的优点,接着引入了直接基于策略学习所需要的目标函数的设计,引入了策...

2019-04-21 21:02:32 4137

转载 强化学习实践七:给Agent添加记忆功能

在《强化学习》第一部分的实践中,我们主要剖析了gym环境的建模思想,随后设计了一个针对一维离散状态空间的格子世界环境类,在此基础上实现了SARSA和SARSA(λ)算法。《强化学习》第二部分内容聚焦于解决大规模问题,这类问题下的环境的观测空间通常是多维的而且观测的通常是连续变量,或者行为不再是离散的简单行为,而是由可在一定区间内连续取值的变量构成,在解决这类大规模问题时必须要对价值函数(或策略函数...

2019-04-16 14:06:24 3603

转载 David Silver强化学习公开课(六):价值函数的近似表示

之前的内容都是讲解一些强化学习的基础理论,这些知识只能解决一些中小规模的问题,很多价值函数需要用一张大表来存储,获取某一状态或行为价值的时候通常需要一个查表操作(Table Lookup),这对于那些状态空间或行为空间很大的问题几乎无法求解,而许多实际问题都是这些拥有大量状态和行为空间的问题,因此只掌握了前面5讲内容,是无法较好的解决实际问题的。本讲开始的内容就主要针对如何解决实际问题。本讲主...

2019-04-12 17:13:21 2502

tensorflow论文中文翻译

TensorFlow: A system for large-scale machine learning 论文的中文翻译。

2018-08-24

parameter server 论文中文翻译

Scaling distributed machine learning with the parameter server 论文中文翻译。

2018-08-13

Real-Time Machine Learning: The Missing Pieces 中文翻译

Real-Time Machine Learning: The Missing Pieces,UC Berkeley RISELab新推出的高性能分布式执行框架的论文,含原文pdf

2018-04-25

东南大学-数据库课件

东南大学-数据库课件,由崇老师上课时使用的课件,介绍数据库及区块链技术。

2018-03-09

东南大学-算法设计与分析课件

东南大学-算法设计与分析课件,由吴老师上课时所使用的课件。

2018-03-09

机器学习Ray框架论文中文版

机器学习Ray框架论文中文翻译,想了解Ray这一框架的可以了解下。

2018-03-09

东南大学-网络体系结构课件

东南大学,网络体系结构讲义,计算机学院董老师授课,讲义基本为英文。

2018-01-19

游戏集合 VC6.0 C++

资源中包含大概20多个游戏,通过C语言编写,运行环境为VC6.0 代码齐全 可供参考学习

2016-04-20

魔兽世界服务端源码

魔兽世界服务端源码(部分) 仅供参考

2016-04-20

24点游戏软件的开发

24点游戏软件的开发 C++编写 可在VC6.0运行

2016-04-20

C++应用编程200例

C++应用编程200例 对于初次接触C C++的人来说,可以借鉴学习增加自己的实力

2016-04-20

MFC飞机大战游戏

MFC飞机大战游戏

2016-04-13

数据结构初试&复试真题

南京邮电大学 数据结构初试&复试真题

2016-04-13

南邮数据结构初试真题&南邮本校上课PPT&辅导班讲义

南邮数据结构初试真题&南邮本校上课PPT&辅导班讲义

2016-04-13

C++组成算法实现二(盐城工学院课程设计)

C++组成原理算法实现二(盐城工学院课程设计) VC++6.0 IDE

2016-04-13

Game2048游戏 C++实现

Game2048游戏 C++实现 前段时间 很火的一个手机APP游戏,通过C++植入到电脑上

2016-04-13

小型聊天软件 C++(类似企鹅那种)

小型聊天软件 C++(类似企鹅那种)

2016-04-13

国际象棋 C++实现

国际象棋 C++实现

2016-04-13

俄罗斯方块程序(C语言编写)

俄罗斯方块程序(C语言编写)

2016-04-13

BAT命令大全

BAT命令大全

2016-04-13

tomcat 参考文档

tomcat 参考文档

2016-04-13

VC++ MFC中文参考文档

VC++ MFC中文参考文档

2016-04-13

C语言程序设计(谭浩强)

C 程序设计

2016-03-12

HTML5从入门到精通

HTML5从入门到精通 中文版

2016-03-12

Android开发从入门到精通学习文档

2016-03-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除