自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

xl.zhang的博客

海阔任鱼跃,天高任鸟飞。

  • 博客(4)
  • 资源 (32)
  • 收藏
  • 关注

转载 David Silver强化学习公开课(三):动态规划寻找最优策略

本讲着重讲解了利用动态规划来进行强化学习,具体是进行强化学习中的“规划”,也就是在已知模型的基础上判断一个策略的价值函数,并在此基础上寻找到最优的策略和最优价值函数,或者直接寻找最优策略和最优价值函数。本讲是整个强化学习课程核心内容的引子。 简介 Introduction动态规划算法是解决复杂问题的一个方法,算法通过把复杂问题分解为子问题,通过求解子问题进而得到整个问题的解。在解决子问...

2018-10-31 09:44:19 4496

转载 David Silver强化学习公开课(二):马尔科夫决策过程

在强化学习中,马尔科夫决策过程(Markov decision process, MDP)是对完全可观测的环境进行描述的,也就是说观测到的状态内容完整地决定了决策的需要的特征。几乎所有的强化学习问题都可以转化为MDP。本讲是理解强化学习问题的理论基础。 马尔科夫过程 Markov Process 马尔科夫性 Markov Property某一状态信息包含了所有相关的历史,只要当前...

2018-10-29 09:10:13 2695

转载 David Silver强化学习公开课(一):简介

本讲是对于强化学习整体的一个简单介绍,描述了强化学习是什么,解决什么问题,大概用什么样的方式来解决问题。介绍了强化学习中常用的概念。这些概念非常重要,贯穿于整个强化学习始终,但是在这一讲,读者仅需对这些概念有个初步的印象。 引子强化学习在不同领域有不同的表现形式:神经科学、心理学、计算机科学、工程领域、数学、经济学等有不同的称呼。强化学习是机器学习的一个分支:监督学习、无监督学习、...

2018-10-24 20:27:55 2878

原创 Ray: Scheduling and Actor placement

Ray是面向增强学习场景的分布式计算框架,相关介绍参考博客。本篇文章主要对 Ray中 remote函数的调度以及 Actor抽象的放置进行介绍。 一、Remote函数的调度1. Remote函数的定义Remote函数时Ray分布式计算中的核心概念,一般如下所示:@ray.remotedef add(a, b): return a + bid_c = add....

2018-10-24 19:26:53 2562

tensorflow论文中文翻译

TensorFlow: A system for large-scale machine learning 论文的中文翻译。

2018-08-24

parameter server 论文中文翻译

Scaling distributed machine learning with the parameter server 论文中文翻译。

2018-08-13

CIEL 论文中文翻译

CIEL : a universal execution engine for distributed data-flow computing论文中文翻译。

2018-08-13

Real-Time Machine Learning: The Missing Pieces 中文翻译

Real-Time Machine Learning: The Missing Pieces,UC Berkeley RISELab新推出的高性能分布式执行框架的论文,含原文pdf

2018-04-25

东南大学-数据库课件

东南大学-数据库课件,由崇老师上课时使用的课件,介绍数据库及区块链技术。

2018-03-09

东南大学-算法设计与分析课件

东南大学-算法设计与分析课件,由吴老师上课时所使用的课件。

2018-03-09

机器学习Ray框架论文中文版

机器学习Ray框架论文中文翻译,想了解Ray这一框架的可以了解下。

2018-03-09

东南大学-网络体系结构课件

东南大学,网络体系结构讲义,计算机学院董老师授课,讲义基本为英文。

2018-01-19

游戏集合 VC6.0 C++

资源中包含大概20多个游戏,通过C语言编写,运行环境为VC6.0 代码齐全 可供参考学习

2016-04-20

魔兽世界服务端源码

魔兽世界服务端源码(部分) 仅供参考

2016-04-20

24点游戏软件的开发

24点游戏软件的开发 C++编写 可在VC6.0运行

2016-04-20

C++应用编程200例

C++应用编程200例 对于初次接触C C++的人来说,可以借鉴学习增加自己的实力

2016-04-20

linux内核完全注释

linux内核完全注释

2016-04-13

MFC飞机大战游戏

MFC飞机大战游戏

2016-04-13

数据结构初试&复试真题

南京邮电大学 数据结构初试&复试真题

2016-04-13

南邮数据结构初试真题&南邮本校上课PPT&辅导班讲义

南邮数据结构初试真题&南邮本校上课PPT&辅导班讲义

2016-04-13

C++组成算法实现二(盐城工学院课程设计)

C++组成原理算法实现二(盐城工学院课程设计) VC++6.0 IDE

2016-04-13

Game2048游戏 C++实现

Game2048游戏 C++实现 前段时间 很火的一个手机APP游戏,通过C++植入到电脑上

2016-04-13

小型聊天软件 C++(类似企鹅那种)

小型聊天软件 C++(类似企鹅那种)

2016-04-13

国际象棋 C++实现

国际象棋 C++实现

2016-04-13

俄罗斯方块程序(C语言编写)

俄罗斯方块程序(C语言编写)

2016-04-13

PING命令入门详解及应用举例

PING命令入门详解及应用举例

2016-04-13

BAT命令大全

BAT命令大全

2016-04-13

tomcat 参考文档

tomcat 参考文档

2016-04-13

VC++ MFC中文参考文档

VC++ MFC中文参考文档

2016-04-13

C语言程序设计(谭浩强)

C 程序设计

2016-03-12

HTML5从入门到精通

HTML5从入门到精通 中文版

2016-03-12

程序员SQL金典

SQL 数据库

2016-03-12

Android开发从入门到精通学习文档

2016-03-12

指针数组和数组指针

对于新手更好地了解指针数组有一些帮助

2016-03-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除