强化学习
文章平均质量分 96
ZiSeoi
四川大学本科2018级自动化专业学生。感兴趣方向有自动控制,机器视觉,强化学习与硬件开发。
展开
-
玩转星际争霸局部战斗 —— QMIX
这里写自定义目录标题写在前面QMIX 论文解读多智能体的相关工作Dec-POMDPDRQNIQL(Independent Q-Learning)VDN(Value Decomposition Networks)QMIXQMIX 结构核心——单调性约束在 aistudio 上运行 QMIX环境准备测试游戏环境QMIX 代码部分执行部分定义 agent 网络结构Mixing 网络定义策略与训练部分主函数部分(负责定义与调度)开始训练建议使用 visual 打开 run 文件夹进行训练曲线的监测,当训练收敛并稳定原创 2021-04-19 21:16:52 · 3021 阅读 · 1 评论 -
探索的大胜利——随机网络蒸馏(Random Network Distillation)
本项目是之前写过的一个项目项目——[好奇心驱动的强化学习](https://aistudio.baidu.com/aistudio/projectdetail/1434970)中鼓励探索机制(好奇心机制也是其中一种)的另一种形式,对好奇心还不是很熟悉的童鞋可以看看。原创 2021-03-09 22:05:00 · 3827 阅读 · 9 评论 -
强化学习 Reinforcement Learning(七)—— 值分布强化学习算法 C51
本文主要介绍值分布强化学习的一些基本概念,然后聊一聊值分布强化学习的开山之作 —— C51。原创 2021-03-02 10:40:16 · 3366 阅读 · 1 评论 -
基于 Paddle2.0 的强化学习新玩法 —— 通关超级马里奥兄弟
超级马里奥兄弟作为几代人的童年回忆,陪伴了我们的成长。如今随着深度强化学习的发展,越来越多的游戏已经被 AI 征服,那么今天我们展示如何用深度强化学习,试着通关超级马里奥兄弟吧!原创 2021-01-24 18:35:58 · 932 阅读 · 3 评论 -
强化学习 Reinforcement Learning(六)——好奇心驱动的强化学习
本文将讲述关于好奇心机制的主要内容,向读者展示什么是好奇心机制,最后复现 ICM ,并与我们熟悉的 DQN 相结合噢噢,差点忘了,本文的代码全部基于 paddle2.0rc 版本原创 2021-01-12 16:16:04 · 3660 阅读 · 5 评论 -
强化学习 Reinforcement Learning(四)——如何使用百度 PARL 框架通关马里奥兄弟
快把代码跑起来,看看你的模型什么时候能通关吧!!!(????叫)原创 2020-11-28 14:04:51 · 927 阅读 · 2 评论 -
强化学习 Reinforcement Learning(三)——是时候用 PARL 框架玩会儿 DOOM 了!!!(下)
代码部分原创 2020-11-01 18:40:16 · 259 阅读 · 3 评论 -
强化学习 Reinforcement Learning(二)——是时候用 PARL 框架玩会儿 DOOM 了!!!(上)
突然发现一直好像还没有人用百度的 PARL 玩过毁灭战士,所以这两天在学习之余娱乐一下,给大家整个活儿:)原创 2020-11-01 16:58:18 · 412 阅读 · 1 评论 -
强化学习 Reinforcement Learning(一)
简单理解强化学习(Reinforcement Learning)本文目录简单理解强化学习(Reinforcement Learning)什么是强化学习强化学习分类方法汇总什么是强化学习强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。强化学习的常见模型是标准的马尔可夫决策过程(Markov Decision Pro原创 2020-09-21 22:34:40 · 631 阅读 · 2 评论