TypeError: zip argument #N must support iteration
观察:
正常的replaybuffer中每次都会存None,而添加的HER的额外样本后出现了这个问题.
打印batch发现存在很多的none样本.
原本buffer采用数组,后改为队列存储,当满的时候会将最先进去的样本数组踢出,故尝试取消None空样本.跑了20eps没有问题.
错误定位:
state, action, reward, next_state, done = map(np.stack, zip(*batch))
#numpy.stack(arrays, axis=0)沿着新轴连接数组的序列。每
原创
2021-05-11 14:15:11 ·
1678 阅读 ·
1 评论