torchvision
包含众多流行数据集和图像处理方法
Dataset类
PyTorch 读取图片,主要是通过 Dataset 类,所有的 datasets 都需要继承它
要让PyTorch读取自己的数据集,只要两步:
- 制作图片数据的索引
- 构建Dataset子类
所谓数据集,无非就是一组{x:y}的集合吗,你只需要在这个类里说明“有一组{x:y}的集合”就可以了
对于图像分类任务,图像+分类
对于目标检测任务,图像+bbox、分类
DeepLesion数据集
- 4427名独立的匿名患者
- 10594次CT扫描(平均每位患者有3次随访)
- 32735个带标记的病灶实例
- 一共928020张CT横切图像(512×512分辨率)