MindSpore数据集报错【The data pipeline is not a tree】

小乐快乐

于 2023-02-20 15:31:33 发布

阅读量153

点赞数

文章标签：深度学习人工智能算法

本文链接：https://blog.csdn.net/weixin_45666880/article/details/129125352

版权

使用MindSpore定义数据集的时候，有时候因为定义数据集过于复杂，导致出现了一个error

ValueError: The data pipeline is not a tree (i.e. one node has 2 consumers)

打开脚本一看，果然数据处理pipeline在定义上发生了分支，导致流水线无法确定分叉的走向：

# 在这种情况相当于dataset1有两个消费节点dataset2, dataset3，如上面的代码所示：
dataset2 = dataset1.map(***)
dataset3 = dataset1.map(***)

dataset定义上发生了分支，导致dataset1无法确定分叉的走向，究竟是走向dataset2，还是dataset3，所以这是错误的数据集定义方式

解决办法：

通常保持同一个数据集名称，可以修改成如下

import mindspore.dataset as ds
import mindspore.dataset.vision.c_transforms as C

dataset1 = ds.TFRecordDataset(dataset_dir)
dataset1 = dataset1.map(operations=[C.Resize(256)], input_columns="image", num_parallel_workers=8)
dataset1 = dataset1.map(operations= C.CenterCrop, input_columns="image", num_parallel_workers=8)

一直保持同一个数据集名称即可解决

其他错误相关帖：