自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (9)
  • 收藏
  • 关注

原创 【强化学习笔记】从 “酒鬼回家” 认识Q Learning算法

1.背景 现在笔者来讲一个利用Q-learning 方法帮助酒鬼回家的一个小例子, 例子的环境是一个一维世界, 在世界的右边是酒鬼的家。这个酒鬼因为喝多了,根本不记得回家的路,只是根据自己的直觉一会向左走、一会向右走。酒鬼最后只要成功回家, 然后以后就记住了回家的方法, 这就是他用强化学习所学习到的行为。 -w- - - - - H H 是酒鬼的家, w 是酒鬼所处的位置 ...

2018-02-20 00:55:42 945

CUDA-Z-0.10.251.dmg

CUDA-Z-0.10.251.dmg CUDA-Z-0.10.251.dmg CUDA-Z-0.10.251.dmg

2018-03-13

Super ScrollView for UGUI.unitypackage

Super ScrollView for UGUI.unitypackage 好用的unity滚动菜单插件

2017-12-14

wget-1.19.2.tar

wget-1.19.2.tar wget-1.19.2.tar wget-1.19.2.tar wget-1.19.2.tar wget-1.19.2.tar wget-1.19.2.tar

2017-12-14

模拟电路复习题

模拟电路复习题

2016-11-02

《离散数学》(屈婉玲,耿素云)习题解答

《离散数学》(屈婉玲,耿素云)习题解答

2016-11-02

数字信号处理-基于计算机的方法(第四版)答案

数字信号处理-基于计算机的方法(第四版)答案 基于计算机的方法_第四版_Sanjit-K.Mitra_习题答案[2-7章]

2016-09-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除