Learning From Video DRL &&OpenAI Five
Overcoming sparse rewards in Deep RL: Curiosity, hindsight & auxiliary tasks
Sparse rewards
比较离散的reward signal,也就是说,在玩儿一些特定游戏的时候无法确定是否通过一个reward就能明确判断结果的输赢。也就是说需要连续的决策动作序列才能到达成功的情况。如下图所示:
Reinfor...
原创
2019-05-02 20:49:01 ·
306 阅读 ·
0 评论