MindSpore数据集报错【The data pipeline is not a tree】

使用MindSpore定义数据集的时候,有时候因为定义数据集过于复杂,导致出现了一个error

ValueError: The data pipeline is not a tree (i.e. one node has 2 consumers)

打开脚本一看,果然数据处理pipeline在定义上发生了分支,导致流水线无法确定分叉的走向:

# 在这种情况相当于dataset1有两个消费节点dataset2, dataset3,如上面的代码所示:
dataset2 = dataset1.map(***)
dataset3 = dataset1.map(***)

dataset定义上发生了分支,导致dataset1无法确定分叉的走向,究竟是走向dataset2,还是dataset3,所以这是错误的数据集定义方式

解决办法:

  • 通常保持同一个数据集名称,可以修改成如下

    import mindspore.dataset as ds
    import mindspore.dataset.vision.c_transforms as C
    
    dataset1 = ds.TFRecordDataset(dataset_dir)
    dataset1 = dataset1.map(operations=[C.Resize(256)], input_columns="image", num_parallel_workers=8)
    dataset1 = dataset1.map(operations= C.CenterCrop, input_columns="image", num_parallel_workers=8)

    一直保持同一个数据集名称即可解决

其他错误相关帖:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值