![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文笔记
彩虹糖梦
A penny for my thoughts, oh no I’ll sell them for a dollar. They're worth so much more after I’m a goner.
展开
-
强化学习:DDPG到MADDPG
本文主要关注于强化学习中基于策略梯度的方法。首先会简要介绍什么是策略梯度,什么是Actor-Critic算法,之后会重点讲述DDPG(Deep Deterministic Policy Gradient)算法,以及DDPG的多智能体版本:MADDG(Multi-agent Deep Deterministic Policy Gradient)。策略梯度(Policy Gradient)与基于策略梯度(Policy Based)的方法相对应的,是基于动作价值函数(Value Based)的方法。我们熟原创 2020-12-10 10:52:54 · 10117 阅读 · 8 评论 -
论文笔记:Software-Defined Networks with Mobile Edge Computing and Caching for Smart Cities
Software-Defined Networks with Mobile Edge Computing and Caching for Smart Cities: A Big Data Deep Reinforcement Learning Approach文章基本概况作者:Ying He, F. Richard Yu, Nan Zhao, Victor C.M. Leung, a...原创 2019-07-29 11:22:25 · 816 阅读 · 0 评论 -
论文笔记:Dyna, an Integrated Architecture for Learning, Planning, and Reacting
文章基本概况标题:Dyna, an Integrated Architecture for Learning, Planning, and Reacting作者:Richard S. Sutton,强化学习教父,被认为是现代计算的强化学习创立者之一。他为该领域做出了许多重大贡献,包括:时间差分学习(temporal difference learning)、策略梯度方法(policy gr...原创 2019-07-30 11:01:16 · 936 阅读 · 0 评论 -
论文笔记:Human-level control through deep reinforcement learning
Human-level control through deep reinforcement learning论文链接:https://courses.cs.washington.edu/courses/cse571/16au/slides/dqn_nature.pdf论文来源:Nature(还是第一次读nature上的论文)论文摘要强化学习的理论根植于心理学和行为学在...原创 2019-08-05 11:28:25 · 3781 阅读 · 0 评论 -
论文笔记:Domain Randomization for Transferring Deep Neural Networks from Simulation to the Real World
Domain Randomization for Transferring Deep Neural Networks from Simulation to the Real World文章概况作者:Josh Tobin, Rachel Fong, Alex Ray, Jonas Schneider, Wojciech Zaremba, Pieter Abbeel来源:2017 I...原创 2019-08-05 16:40:01 · 5564 阅读 · 0 评论 -
算法笔记:Playing Atari with Deep Reinforcement Learning
Playing Atari with Deep Reinforcement Learning比较尴尬,上篇文章不是DQN的来源,这篇才是。上篇Nature文章对于DQN做出的改进上次没读明白,查看其他资料,做实践的时候才明白。关于Nature的改进下面会提到。基本信息作者:VolodymyrMnih KorayKavukcuoglu DavidSilver AlexGrav...原创 2019-08-11 21:49:07 · 7307 阅读 · 0 评论 -
论文笔记:A Survey of Research on Cloud Robotics and Automation
A Survey of Research on Cloud Robotics and Automation摘要云是一种基础设施和广泛的互联网接入资源,有潜力为机器人和自动化系统提供巨大的好处。本次调查围绕四大潜在效益展开:1)大数据:图像、地图、轨迹和对象数据的访问存储库;2)云计算:根据统计分析、学习和运动规划的需要访问并行网格计算;3)集体机器人学习:机器人共享轨迹、控制策略和...原创 2019-08-22 10:03:25 · 487 阅读 · 0 评论 -
论文笔记:Dueling Network Architectures for Deep Reinforcement Learning
题目:Dueling Network Architectures for Deep Reinforcement Learning来源:ICML 2016 Best Paper摘要在最近几年中,在强化学习中使用深度学习的表示取得了很大的成功。这些应用依然使用了比较传统的架构。比如卷积网络,LSTM或者自动编码器。在本文中,作者提出了一个新的用于model free强化学习的神经网络...原创 2019-09-17 16:19:19 · 791 阅读 · 0 评论