2018年04月_monkey_rose

12月 09月 08月 07月 04月 03月 02月 01月

原创 Playing atari with deep reinforcement learning

Introduction 传统RL手动提取选择特征，DL(CNN)可以根据raw sensory的数据抽象出一些high-level特征，DRL的困难： DL训练使用大量的labeled数据，而RL数据量小，且reward和action之间的delay DL样本间独立，RL样本间相关 RL样本的分布随着学习改变，DL中设定的固定的分布本文针对2，3困难的方法： experience...

2018-04-10 14:35:53 868

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人