MindSpore数据集加载-GeneratorDataset卡住、卡死

最新推荐文章于 2023-04-23 15:26:21 发布

小乐快乐

最新推荐文章于 2023-04-23 15:26:21 发布

阅读量177

点赞数

文章标签： python numpy 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45666880/article/details/129125168

版权

MindSpore可以自定义Python数据源，通过迭代该数据源构造数据集。有点类似PyTorch的DataLoader。

相关的API可以参考：mindspore.dataset.GeneratorDataset

自定义GeneratorDataset处理数据集时，混用numpy.ndarray 和 mindspore.Tensor 的操作会出现卡死

GeneratorDataset接口自定义的数据集，脚本如下：

原因分析：

猜测在自定义的数据处理中，存在numpy.ndarray -> mindspore.Tensor -> numpy.ndarray的混用过程，并且错误地使用numpy.array(Tensor)做转换，导致GIL锁得不到释放，GeneratorDataset不能正常工作。

打印堆栈分析后证明这个猜想，堆栈：

这个堆栈可以用py-spy这个工具获得，主要是为了看每一个进程目前运行的所在位置（神器啊！！！）

GeneratorDataset处理数据卡住问题，一般为竞争GIL导致的死锁问题，推荐使用 py-spy dump -pid {PID}来定位。

解决办法：

在GeneratorDataset的第一个入参`source`的定义时，涉及到Python function中全部使用numpy.ndarray来替代Tensor
使用Tensor.asnumpy()方法替换numpy.array(Tensor)

对于这个问题，可以在代码的218行，把np.array(image)和np.array([record.label]) 换成 image.asnumpy()和record.label.asnumpy()

其他错误相关帖：

华为云论坛_云计算论坛_开发者论坛_技术论坛-华为云

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MindSpore数据集加载-GeneratorDataset卡住、卡死

猜测在自定义的数据处理中，存在numpy.ndarray -> mindspore.Tensor -> numpy.ndarray的混用过程，并且错误地使用numpy.array(Tensor)做转换，导致GIL锁得不到释放，GeneratorDataset不能正常工作。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。