- 博客(4)
- 收藏
- 关注
原创 多智能体强化学习——值分解方法代码流程
主要参考:官方库:https://github.com/oxwhirl/pymarl/大佬实现的库:https://github.com/starry-sky6688/StarCraft/大佬的库通俗易懂但大佬的库由于框架结构的问题,没实现double q 。我加了一下,貌似没啥大区别;另外貌似不是很适合MPE环境...... 难顶 maddpg永远滴神主要代码流程:①main.py 将配...
2021-10-12 16:30:00
910
原创 多智能体强化学习——值分解方法理论及代码组件
1.理论值分解方法是一种主流的多智能体强化学习解决方案。它使用集中式训练、分布式执行(CTDE)架构(在训练时能得到全局信息,在执行时只需要局部观测),解决部分可观测问题;使用局部动作值函数以一定规则约束(一般为IGM)来拟合全局动作值函数,解决信度分配问题。2.常见算法①VDN 直接把局部值函数直接相加得到全局值函数[1706.05296] Value-Decomposition Networks For Cooperative Multi-Agent Le...
2021-10-12 11:47:30
1401
原创 多智能体强化学习smac环境配置(Linux)
1.创建pymarl环境:conda create -n pymarl python=3.7 -yconda activate pymarl 2.pip安装一些包pip install sacred numpy scipy matplotlib seaborn pyyaml pygame pytest probscale imageio snakeviz tensorboard-logger3.下载安装smacgit clone https://github.com/oxwhir
2021-09-10 20:26:52
2558
原创 本地计算机连接实验室远程服务器注意事项
目的:本地windows系统连接远程服务器Ubuntu 18.04系统,并能使用pycharm远程同步代码1.连接远程服务器一开始想要显示远程桌面,主要参考:Ubuntu 18.04 LTS 使用Xmanager连接图形桌面 - 简书 (jianshu.com)但lightdm可能会造成服务器显示出现问题,未使用。选择使用 xshell + xftp进行远程连接。xshell 使用打开xshell,单击文件新建,出现下面界面,设置主机ip、端口连接即可。...
2021-09-10 19:56:08
326
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人