DQN--经验回放的实现(简单)
经验回放的实现
使用pd.DataFrame()函数定义一个存储经验的表格
存储函数store()
取出一个或多个样本的函数sample()
第一步,在DQNplayer类中,我们需要初始化一个存储结构
pd.DataFrame(index=range(capacity),
columns=['observation','action','reward',
'next_observation','done']
这个表格的行号是range(capacity),即表格中能够存储的经验数量;列号包括
原创
2021-04-19 10:15:46 ·
1612 阅读 ·
0 评论