- 博客(1)
- 资源 (8)
- 问答 (2)
- 收藏
- 关注
转载 David Silver强化学习公开课笔记:Lecture 1 强化学习入门
第一课主要解释了强化学习在多领域的体现,主要解决什么问题,与监督学习算法的区别,完整的算法流程由哪几部分组成,其中agent包含的内容,以及解释了强化学习涉及到的一些概念。 本课视频地址:RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning 本课ppt地址:http://www0.cs.ucl...
2018-05-22 11:24:50 933 3
numpy‑1.12.1+mkl‑cp36‑cp36m‑win_amd64.rar
2020-04-19
cvxopt-1.2.4-cp36-cp36m-win_amd64.whl
2020-04-19
HeadFirst 组合模式+迭代器错误原因以及解决代码
2016-11-29
HeadFirst 命令模式 风扇课本实现错误代码及利用栈的解决办法
2016-11-29
使用 tensorflow 训练网络 loss 突然出现 nan 的情况[已解决]
2018-06-14
anaconda环境问题:CondaEnvironmentNotFoundError
2018-05-25
TA创建的收藏夹 TA关注的收藏夹
TA关注的人