PyTorch中的Dataset

最新推荐文章于 2024-03-10 13:54:21 发布

玄云飘风

最新推荐文章于 2024-03-10 13:54:21 发布

阅读量7.2k

点赞数 1

分类专栏： PyTorch 文章标签： PyTorch Dataset

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tfcy694/article/details/85251036

版权

PyTorch 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

注：本文源码基于PyTorch1.0，目前在PyTorch0.4下没有发现错误。

PyTorch中的Dataset是一个抽象类，我们可以通过继承Dataset来将数据集的源文件、规模和其他非必要的功能打包，从而供DataLoader使用。无论是官方给出的数据集如torchvision.datasets.MNIST等，还是我们在做实验时需要使用自己的数据集，都要继承Dataset类，在继承过程中，须重载的函数包括：

__init__()：构造函数，略过不说。
__getitem__()：_DataLoaderIter()类中有调用：

# https://pytorch.org/docs/stable/_modules/torch/utils/data/dataloader.html
batch = self.collate_fn([self.dataset[i] for i in indices])

__len__()：sampler（如SequentialSampler()类）中有调用len()函数：

# https://pytorch.org/docs/stable/_modules/torch/utils/data/sampler.html
class SequentialSampler(Sampler):
    """Samples elements sequentially, always in the same order.

    Arguments:
        data_source (Dataset): dataset to sample from
    """

    def __init__(self, data_source):
        self.data_source = data_source

    def __iter__(self):
        return iter(range(len(self.data_source)))

    def __len__(self):
        return len(self.data_source)

这三个类是继承时必须重载的函数，我们也可以加入self.loader和self.transform等变量以方便后续处理。需要注意的是，Dataset类只相当于一个打包工具，包含了数据的地址。真正把数据读入内存的过程是由Dataloader进行批迭代输入的时候进行的。

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄7年

105
原创

265
点赞

572
收藏

82
粉丝

关注

私信

热门文章

分类专栏

装机/系统/环境 14篇
CV 35篇
论文阅读 23篇
矩阵理论 3篇
基本功 35篇
python 13篇
caffe 8篇
PyTorch 15篇
error 2篇
cpp 1篇
LaTex 1篇

最新评论

conda常用操作
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)使用更多的站内链接。
PyTorch中的Tensor
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加条理清晰的目录。
【python】《流畅的python》读书笔记之第1-2章
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Deconvolution（逆卷积）
mex_wayne: 加了stride 那段的deconv貌似写的不对，因此decov 是上增，除以stride会减少尺寸，知乎上写的听明白的
【PyTorch】Tensor和tensor的区别
追光者♂: 很不错，感谢分享！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。