TypeError: zip argument #N must support iteration

最新推荐文章于 2023-02-06 18:01:13 发布

Lovemyse1f

最新推荐文章于 2023-02-06 18:01:13 发布

阅读量1.6k

点赞数

分类专栏：强化学习训练

本文链接：https://blog.csdn.net/Lovemyse1f/article/details/116652299

版权

强化学习同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

训练

1 篇文章 0 订阅

订阅专栏

观察:
正常的replaybuffer中每次都会存None,而添加的HER的额外样本后出现了这个问题.
打印batch发现存在很多的none样本.
原本buffer采用数组,后改为队列存储,当满的时候会将最先进去的样本数组踢出,故尝试取消None空样本.跑了20eps没有问题.

错误定位:
state, action, reward, next_state, done = map(np.stack, zip(*batch))
#numpy.stack(arrays, axis=0)沿着新轴连接数组的序列。每个数组形状相同,返回堆叠的数组
# map用途:np.stack函数去计算zip存储的iterator,并产生新的iterator

zip解析
>>> a = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> zip(*a)
[(1, 4, 7), (2, 5, 8), (3, 6, 9)]
>>> map(list,zip(*a))
[[1, 4, 7], [2, 5, 8], [3, 6, 9]]
h,g,m = map(np.stack, zip(*a))
print(h,g,m)
[1 4 7] [2 5 8] [3 6 9]
h,g,m = map(list, zip(*a))
print(h,g,m)
[1, 4, 7] [2, 5, 8] [3, 6, 9]
这种方法速度更快但也更难以理解，将list看成tuple解压，恰好得到我们“行列互换”的效果，再通过对每个元素应用list()函数，将tuple转换为list
https://www.cnblogs.com/strongYaYa/p/5870075.html

Lovemyse1f

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
TypeError: zip argument #N must support iteration

观察:正常的replaybuffer中每次都会存None,而添加的HER的额外样本后出现了这个问题.打印batch发现存在很多的none样本.原本buffer采用数组,后改为队列存储,当满的时候会将最先进去的样本数组踢出,故尝试取消None空样本.跑了20eps没有问题.错误定位:state, action, reward, next_state, done = map(np.stack, zip(*batch))#numpy.stack(arrays, axis=0)沿着新轴连接数组的序列。每
复制链接

扫一扫