ZiSeoi-CSDN博客

原创玩转星际争霸局部战斗 —— QMIX

这里写自定义目录标题写在前面QMIX 论文解读多智能体的相关工作Dec-POMDPDRQNIQL（Independent Q-Learning）VDN（Value Decomposition Networks）QMIXQMIX 结构核心——单调性约束在 aistudio 上运行 QMIX环境准备测试游戏环境QMIX 代码部分执行部分定义 agent 网络结构Mixing 网络定义策略与训练部分主函数部分（负责定义与调度）开始训练建议使用 visual 打开 run 文件夹进行训练曲线的监测，当训练收敛并稳定

2021-04-19 21:16:52 4361 1

原创 Paddle-NEAT——飞桨进化神经网络组件

Paddle-NEAT——飞桨进化神经网络组件目录Paddle-NEAT——飞桨进化神经网络组件写在前面：NEAT 简介基因组的表示基因组的变异节点变异连接变异基因组的交叉最后稍微介绍一下 NEAT 的两种改进形式：HyperNEATAdaptive HyperNEAT运行Paddle-NEAT安装继续来立我们的棍子吧运行一下当然走一下迷宫也是可以滴运行一下写在前面：最近自己写了个把 neat-python 和 paddlepaddle 深度学习框架相结合的套件，取名叫 Paddle-NEAT。链接会

2021-03-09 22:27:13 677

wzduang的博客

原创玩转星际争霸局部战斗 —— QMIX

原创 Paddle-NEAT——飞桨进化神经网络组件

原创探索的大胜利——随机网络蒸馏（Random Network Distillation）

原创强化学习 Reinforcement Learning（七）—— 值分布强化学习算法 C51

原创量子计算基础整理（上）

原创基于 Paddle2.0 的强化学习新玩法 —— 通关超级马里奥兄弟

原创强化学习 Reinforcement Learning（六）——好奇心驱动的强化学习

原创强化学习 Reinforcement Learning（五）—— 使用 K20 单片机玩一个 Q 学习小游戏

原创单目纯视觉避障方案——2020中国机器人大赛FIRA避障仿真组决赛代码开源

原创强化学习 Reinforcement Learning（四）——如何使用百度 PARL 框架通关马里奥兄弟

原创 JETSON 也能摸起来——偷偷打会儿 DOOM 吧：）

原创 git clone 加速的奇怪技巧

原创强化学习 Reinforcement Learning（三）——是时候用 PARL 框架玩会儿 DOOM 了！！！（下）

原创强化学习 Reinforcement Learning（二）——是时候用 PARL 框架玩会儿 DOOM 了！！！（上）

原创数字图像处理——隐形眼镜缺陷检测算法

原创强化学习 Reinforcement Learning（一）

原创 2020全国大学生数学建模C题初尝试——基于 PaddlePaddle LSTM 的中小微企业信贷决策模型

转载机器学习笔记公式推导（一）：第一部分

原创高斯滤波——KF、EKF 与 UKF

原创 ZiSeoi 的西瓜书笔记（二）：第二章模型评估与选择

原创 Pix2Pix——基于GAN的图像风格迁移模型

原创从元件角度简单理解CNN

原创 ZiSeoi的西瓜书笔记（一）：第一章绪论

空空如也

空空如也