报错记录：dataset与dataloader有关

最新推荐文章于 2023-07-26 15:27:34 发布

积极向上的森森同学

最新推荐文章于 2023-07-26 15:27:34 发布

阅读量318

点赞数

分类专栏：报错记录文章标签： python pytorch

本文链接：https://blog.csdn.net/m0_50674282/article/details/131744430

版权

2 篇文章 0 订阅

订阅专栏

卡了我好久。。。知道了答案豁然开朗，就第一次写下了博客去记录(同时谢谢善良的网友)

ValueError: num_samples should be a positive integer value, but got num_samples=0
这个错误是由于传递给一个函数的num_samples参数的值为0而引起的。

百度查到的几个解决办法分别为：
1、修改shuffle参数。
当dataloader设置了batch_sampler和sampler时，不需要shuffle来进行随机，所以将shuffle设置为FALSE即可。
ps：dataloader的参数：

2、len返回的为0，DataLoader读出来后，就报了 got num_samples=0，将这个修改后就正常运行了。

我的错误和第二个原因一样。
因为我在写dataset类的init初始化时，将

self.patch=()
self.mos=[]

然后在getitem中再给self.patch和self.mos赋值，这样读到的len就是0.
总之，在dataset类的初始化中不可以设置为空，一定要给数据长度，否则报错!!!

神奇的是，在我找不到错的时候，碰巧在主程序里写了一句print(dataset[0])后才测试

    for data in train_loader:
        imgs,targets = data
        print(imgs.shape)
        print(targets.shape)

有这句print就可以进行，没这句print就报错。原因是执行了print后调用train_loader=DataLoader()函数，此时self.patch和self.mos就有了值，所以才不会报错。

关注

专栏目录