Tiberium_discover-CSDN博客

原创学习笔记：强化学习之Actor-Critic

写在前面：我是根据莫烦的视频学习的Reinforce learning，具体代码实现包括Q-learning，SARSA，DQN，Policy-Gradient，Actor-Critic以及A3C。（莫凡老师的网站：https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/）今天发表其中的Acto...

2018-11-20 14:27:20 1766 1

原创学习笔记：强化学习之A3C代码详解

写在前面：我是根据莫烦的视频学习的Reinforce learning，具体代码实现包括Q-learning，SARSA，DQN，Policy-Gradient，Actor-Critic以及A3C。（莫凡老师的网站：https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/）今天先发表最后一个也是...

2018-11-18 15:34:21 8420 11

原创机器人找金币------一个经典的强化学习实验

代码之前：这是在电子科大面试（实习）时老师布置的任务，过去学习的基本上是统计学习方法，从来没有接触过强化学习的相关内容，因此走了不少弯路。先简要描述一下问题：在一个十乘十的方格中有一个机器人寻找金币。有一个金矿和水坑分布在该方格处，机器人需要寻找到金币并尽力避开水坑。开始时机器人位于左下角处随机搜索，遇到金币或者水坑后停止搜索，利用强化学习不断迭代逐渐使得机器人找到最优路径。（截图显示的是两个金币...

2018-08-28 00:14:05 4552 6

原创写在代码之前

本科学习智能科学与技术专业，写代码小学生一个，准备分享一些写过的实验程序，都是与机器学习人工智能相关的算法实现，均利用python语言。自认为代码能力不强，也没有人指点一二，也恳请各路大神指点一二，学生在此谢过。...

2018-08-25 12:56:33 319

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 学习笔记：强化学习之Actor-Critic

原创 学习笔记：强化学习之A3C代码详解

原创 机器人找金币------一个经典的强化学习实验

原创 写在代码之前

空空如也

空空如也

原创学习笔记：强化学习之Actor-Critic

原创学习笔记：强化学习之A3C代码详解

原创机器人找金币------一个经典的强化学习实验

原创写在代码之前