自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 学习笔记:强化学习之Actor-Critic

写在前面:我是根据莫烦的视频学习的Reinforce learning,具体代码实现包括Q-learning,SARSA,DQN,Policy-Gradient,Actor-Critic以及A3C。(莫凡老师的网站:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/)今天发表其中的Acto...

2018-11-20 14:27:20 1766 1

原创 学习笔记:强化学习之A3C代码详解

写在前面:我是根据莫烦的视频学习的Reinforce learning,具体代码实现包括Q-learning,SARSA,DQN,Policy-Gradient,Actor-Critic以及A3C。(莫凡老师的网站:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/)今天先发表最后一个也是...

2018-11-18 15:34:21 8420 11

原创 机器人找金币------一个经典的强化学习实验

代码之前:这是在电子科大面试(实习)时老师布置的任务,过去学习的基本上是统计学习方法,从来没有接触过强化学习的相关内容,因此走了不少弯路。先简要描述一下问题:在一个十乘十的方格中有一个机器人寻找金币。有一个金矿和水坑分布在该方格处,机器人需要寻找到金币并尽力避开水坑。开始时机器人位于左下角处随机搜索,遇到金币或者水坑后停止搜索,利用强化学习不断迭代逐渐使得机器人找到最优路径。(截图显示的是两个金币...

2018-08-28 00:14:05 4552 6

原创 写在代码之前

本科学习智能科学与技术专业,写代码小学生一个,准备分享一些写过的实验程序,都是与机器学习人工智能相关的算法实现,均利用python语言。自认为代码能力不强,也没有人指点一二,也恳请各路大神指点一二,学生在此谢过。...

2018-08-25 12:56:33 319

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除