强化学习知多少

国际期刊International Journal of Complexity in Applied Science and Technology,收录进化计算,机器学习和大数据方面的论文, 投稿网址:https://www.inderscience.com/jhome.php?jcode=ijcast

1. 深度强化学习(Deep Reinforcement Learning)

深度强化学习结合了强化学习和深度学习,通过使用深度神经网络处理复杂的、高维度的输入数据,使得算法能够在诸如图像、语音等领域发挥作用。

主要研究学者及代表性论文
  • David Silver

    • 论文: "Mastering the Game of Go with Deep Neural Networks and Tree Search"
    • 简介: 这篇论文描述了AlphaGo程序,该程序结合了深度神经网络和蒙特卡洛树搜索(MCTS),在围棋中击败了世界顶级人类选手。
  • Volodymyr Mnih

    • 论文: "Playing Atari with Deep Reinforcement Learning"
    • 简介: 这篇论文介绍了深度Q网络(DQN),该算法能够通过卷积神经网络(CNN)从原始像素数据中学习在Atari 2600游戏中的最优策略。
  • Sergey Levine

    • 论文: "End-to-End Training of Deep Visuomotor Policies"
    • 简介: 该论文提出了一种端到端训练的方法,用于从原始视觉输入直接生成机器人控制策略。

2. 逆强化学习(Inverse Reinforcement Learning)

逆强化学习旨在从示范行为中推断出奖励函数,这对于理解和模仿人类行为特别有用。

主要研究学者及代表性论文
  • Andrew Ng

    • 论文: "Algorithms for Inverse Reinforcement Learning"
    • 简介: 这篇论文介绍了逆强化学习的基本算法,展示了如何从专家示范中学习奖励函数。
  • Pieter Abbeel

    • 论文: "Apprenticeship Learning via Inverse Reinforcement Learning"
    • 简介: 该论文提出了一种新的逆强化学习算法,用于从专家演示中学习策略,特别应用于机器人控制任务。

3. 多智能体强化学习(Multi-agent Reinforcement Learning)

多智能体强化学习研究多个智能体在共享环境中相互作用和协作学习的策略。

主要研究学者及代表性论文
  • Michael L. Littman

    • 论文: "Markov Games as a Framework for Multi-Agent Reinforcement Learning"
    • 简介: 这篇论文介绍了将马尔可夫博弈作为多智能体强化学习的框架,解决了多个智能体相互作用的问题。
  • Peter Stone

    • 论文: "Multiagent Systems: A Survey from a Machine Learning Perspective"
    • 简介: 这篇综述论文介绍了多智能体系统的研究现状和挑战,特别是从机器学习的角度。

4. 模仿学习(Imitation Learning)

模仿学习通过观察和模仿专家的行为来学习策略,而不是通过试错来获得奖励信号。

主要研究学者及代表性论文
  • Jonathan HoStefano Ermon

    • 论文: "Generative Adversarial Imitation Learning"
    • 简介: 这篇论文提出了一种新的模仿学习方法,基于生成对抗网络(GAN)来学习专家行为。
  • Pieter AbbeelAndrew Ng

    • 论文: "Apprenticeship Learning via Inverse Reinforcement Learning"
    • 简介: 该论文不仅在逆强化学习上有重要贡献,还提出了通过模仿学习从专家演示中学习复杂任务的方法。

其他重要研究者

  • Richard S. SuttonAndrew G. Barto

    • 书籍: "Reinforcement Learning: An Introduction"
    • 简介: 这本书是强化学习领域的经典教材,全面介绍了强化学习的基础理论、算法和应用。
  • Yoshua Bengio

    • 书籍: "Deep Learning"
    • 简介: 这本书虽然主要集中在深度学习上,但也涵盖了深度强化学习的相关内容,帮助读者理解如何将深度学习应用于强化学习问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值