论文笔记3:Dynamic Frame skip Deep Q Network(DFDQN)

该篇论文笔记介绍了DFDQN,一种在DQN基础上增加动态跳帧率的深度强化学习方法。通过学习选择动作重复次数,DFDQN能针对不同游戏场景调整策略,提升性能。实验显示,在特定游戏中,DFDQN的调整跳帧率策略在奖励和Q值上表现出优势,尤其是在Seaquest和Space Invader游戏中。
摘要由CSDN通过智能技术生成

参考文献:Dynamic Frame skip Deep Q Network

我的知乎:uuummmmiiii(与CSDN同名)

如有错误,请指明,我将立即改正,谢谢。


创新点:DQN基础上增加了选择动作重复次数的输出(构建动态跳帧模型)

改进:将DQN的全连接层变成了1024个单元,并且增加一层全连接层(36个单元)

改进原因:因为游戏玩法不同,有的需要进行快速决策,有的游戏需要进行一连串的相同动作

带来益处:

进行快速决策的游戏(如),降低跳帧率,提高性能(就是玩的更好了。。。);

进行连续相同动作的游戏,提升跳帧率(the frame skip rate),使游戏一个回合时间缩短,并且可以减少动作序列


Abstract

跳帧率k:表示允许agent重复已选出的动作 k次 (A frame skip

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值