- 博客(3)
- 资源 (20)
- 收藏
- 关注
翻译 OpenAI重磅开源多智能体博弈环境Neural MMO
OpenAI官方发布一个Neural MMO——一个用于增强学习代理的大规模多代理博弈环境。平台支持大量的,可变数量智能体在开放式任务中进行训练。大量不同种类的智能体能够使得强化学习更好地进行探索。 
 尽管这两年对多智能体强化学习的研究取得了蓬勃的发展,但是在多智能体强化学习问题里面还存在两个主要的问题:复杂性和任务的开放性。我们需要创建具有高复杂性上限的开放式任务(...
2019-03-05 11:51:44 1707 2
原创 Lecture 6:值函数近似
本文是自己学习David Silver课程的学习笔记:原视频可以在油管或者B站上搜到。 PPT的连接如下:http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html。网速慢的话可以点击这里。 这里将会讲更深层次的东西,我们将会讲强化学习是如何应用到实际生活当中的。 强化学习需要解决large-scale的问题,什么是large-s...
2019-03-04 17:29:14 475
翻译 工具使用教程(二)【Github上传文件大于100M的文件】
1.下载软件。 2.设置1次 LFS: git lfs install 3.然后 跟踪一下你要push的大文件的文件或指定文件类型 git lfs track "*.pdf" 4.以上已经设置完毕, 其余的工作就是按照正常的 add , commit , push 流程就可以了 : 参考:文章。 git add yourLargeFile.pdf git commit -m ...
2019-03-02 12:20:19 728 1
基于Verilog语言的FPGA交通灯设计.zip
2020-06-29
A股-行业-市值排名python排序.zip
2020-06-24
元策略优化的MBRL算法.pptx
2020-05-17
数学建模优质资料.zip
2020-03-11
数学建模思想方法大全及方法适用范围(主讲人厚积薄发-数学中国版主).pdf
2020-03-11
mcm2018blanguages.zip
2020-03-11
研究生学术综合英语1-6课课文及翻译.pdf
2020-03-03
基于强化学习的倒立摆控制策略Matlab实现.zip
2020-01-10
《统计学习方法》第2版课件.zip
2019-11-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人