自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 多智能体强化学习——值分解方法代码流程

主要参考:官方库:https://github.com/oxwhirl/pymarl/大佬实现的库:https://github.com/starry-sky6688/StarCraft/大佬的库通俗易懂但大佬的库由于框架结构的问题,没实现double q 。我加了一下,貌似没啥大区别;另外貌似不是很适合MPE环境...... 难顶 maddpg永远滴神主要代码流程:①main.py 将配...

2021-10-12 16:30:00 910

原创 多智能体强化学习——值分解方法理论及代码组件

1.理论值分解方法是一种主流的多智能体强化学习解决方案。它使用集中式训练、分布式执行(CTDE)架构(在训练时能得到全局信息,在执行时只需要局部观测),解决部分可观测问题;使用局部动作值函数以一定规则约束(一般为IGM)来拟合全局动作值函数,解决信度分配问题。2.常见算法①VDN 直接把局部值函数直接相加得到全局值函数[1706.05296] Value-Decomposition Networks For Cooperative Multi-Agent Le...

2021-10-12 11:47:30 1401

原创 多智能体强化学习smac环境配置(Linux)

1.创建pymarl环境:conda create -n pymarl python=3.7 -yconda activate pymarl 2.pip安装一些包pip install sacred numpy scipy matplotlib seaborn pyyaml pygame pytest probscale imageio snakeviz tensorboard-logger3.下载安装smacgit clone https://github.com/oxwhir

2021-09-10 20:26:52 2558

原创 本地计算机连接实验室远程服务器注意事项

目的:本地windows系统连接远程服务器Ubuntu 18.04系统,并能使用pycharm远程同步代码1.连接远程服务器一开始想要显示远程桌面,主要参考:Ubuntu 18.04 LTS 使用Xmanager连接图形桌面 - 简书 (jianshu.com)但lightdm可能会造成服务器显示出现问题,未使用。选择使用 xshell + xftp进行远程连接。xshell 使用打开xshell,单击文件新建,出现下面界面,设置主机ip、端口连接即可。...

2021-09-10 19:56:08 326

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除