pytorch自定义Dataset心得

最新推荐文章于 2024-05-06 17:05:30 发布

Astrophily

最新推荐文章于 2024-05-06 17:05:30 发布

阅读量1.6k

点赞数 2

分类专栏： Pytorch 个人经验文章标签： pytorch

本文链接：https://blog.csdn.net/qq_39502099/article/details/123678899

版权

6 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

自己写自定义Dataset类的时候参考了 PyTorch中文文档

Dataset规定所有的子类都必须包含有两个方法__len__和__getitem__

以下是自己的一点小心得：

__len__返回的可以是整个长度，也可以不是，只要你__getitem__能够解析item参数即可
__getitem__需要传入一个item参数，作为索引，并返回相应的数据tansor，我看了有些Dataset基类是只返回一个样本的tansor的，并没有返回label的tansor
在DataLoader中定义了Dataset，Dataloader会给Dataset一个索引，也就是item，item的索引范围是0到__len__-1，并不是0到__len__
如果数据集存放方式比较复杂，需要注意对item的解析

以上就是我自己写Dataset的一点小心得
纯深度学习小白，高手勿喷

关注

专栏目录