自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

翻译 DQN

DQN 算法分析: 我们的环境是确定性的,所以为了简单起见,这里给出的所有方程也是确定性地制定的。 在强化学习文献中,他们也将对环境随机转换产生预估。我们的目标是训练一个策略来最大化回报Rt0=∑∞t=t0γt−t0rtR_{t_0} = \sum_{t=t_0}^{\infty} \gamma^{t - t_0} r_t, γ\gamma是折扣,是00到11之间的一个常数,用来保证和是收敛的。它

2019-04-14 23:05:47 5987

原创 C++ 数组直接存入已有的动态Eigen 矩阵 (Mapping array back to an existing Eigen matrix)

C++ 数组直接存入已有的动态Eigen 矩阵Mapping array back to an existing Eigen matrix准备工作:#include <Eigen/Dense>using namespace Eigen;构建一个动态矩阵,并创建一个数据,一维即可:MatrixXf testMat;float tt[] = {1.2, ...

2018-03-02 17:45:01 6179 1

翻译 强化学习介绍

两年前,伦敦的一家小公司DeepMind向Arxiv上传了他们的开创性论文“ Playing Atari with Deep Reinforcement Learning ”。在那篇文章中,他们演示了计算机是如何通过只观察屏幕像素,并在游戏得分增加时收到奖励这种学习模式去玩Atari 2600 视频游戏的。结果是显著的,因为每个游戏和每个游戏的目标是非常不同的,这些设计的游戏对人类而言也是不小的挑战

2017-03-21 17:14:38 10734

原创 Ubuntu16.04快速安装/更新Tensorflow

这里我们介绍的方式只是针对pip安装轮子版,并且博主是升级版本, 所以已经配置好了Cuda和cudnn,如果你没有配置过那么请先想办法 配置好再继续,或者你可以试试如下命令: $ sudo apt-get install libcupti-dev 这个是TF安装说明里说的,本人没试过。由于在国内直接用pip安装网速层次不齐,所以我们先更换pip源: 在 ~/.pip/pip.co

2017-02-18 13:18:02 4118

原创 Ubuntu上Inkscape实现Latex输入方法

写这篇文章作者的实现平台具体是Ubuntu16.04,方法有从网上参考,但可能平台有差异,修改后方可使用,这里给出所有步骤如下:步骤: * 安装 Texlive: sudo apt-get install texlive * 安装 inkscape: sudo apt-get install inkscape * 安装 pstoedit: sudo apt-get install pst

2017-02-17 19:12:18 2622 1

原创 VS2015缺少stdio.h等头文件的解决方案

在属性页中添加如下2条信息即可:首先其次

2016-03-06 14:28:51 14856 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除