前言
复现以前的论文时,源代码中对数据集的处理还都是作者自己写的,而现在大部分pytorch写的代码中都是使用Dataset类结合DataLoader对数据集进行读取,因此尝试自己将源代码改写为符合Dataset类要求的结构,网上已经有很丰富的教程,这里主要记录一下自己的学习过程。
一、Dataset类是什么?
Dataset类是Pytorch官方定义的数据集接口,我们可以根据其要求创建自己的适应任意要求的数据接口。我们首先直接从官方给的代码入手,其中__getitem__和__len__子类是必须继承的,其实有这两部分,数据集也就可以直接使用了。