dataset for semantic sgementation ,图像分割任务中VOC的augment dataset 到底在哪?

     

一、VOC12_AUG

     大多数近期的论文都提到了,自己使用的是“we use augmented data with the annotation of XXX result in 10582 ,1449 and 1456 for training ,validation and testing”也就是“Semantic contours from inverse detector”这片文章提出的一个对于VOC2011数据集等一个额外增加的数据集。

       “Semantic contours from inverse detector” 这篇文章提到的数据集也是通常大家称之为“SBD”,位于这个网站,上面还有一些专门的说明:http://home.bharathh.info/pubs/codes/SBD/download.html,那么下载下来之后就会发现,这个名叫benchmark的文件夹里train.txt内只包含了8498个图像,val.txt中包含了2857个图像,而且这个网上说了,这个训练集包含了部分验证集中的图像。

      那么这个10582到底怎么来的呢,pascal的官网上也没有这个下载链接,找了好久之后,我终于在某个好心人的博客中找到了结果,他还提供了下载链接"http://www.sun11.me/blog/2018/how-to-use-10582-trainaug-images-on-DeeplabV3-code/"这是好心人的博客地址。

       下载地址需要vpn,pascal_voc_train_aug.txt 位于这个网页中,直接拷贝然后创建一个train.txt粘贴上去就完成了,得到了10582 “https://gist.githubusercontent.com/sun11/2dbda6b31acc7c6292d14a872d0c90b7/raw/5f5a5270089239ef2f6b65b1cc55208355b5acca/trainaug.txt” 原始图像位于“VOCdevkit/VOC2012/JPEGImages”文件夹下,把pascal_voc_train_aug.txt 放到“VOCdevkit/VOC2012/ImageSets”文件夹下,验证集和测试集直接就是VOC2012数据集下载下来的那两个。

        标注,也就是labels下载需要翻墙“https://www.dropbox.com/s/oeu149j8qtbs1x0/SegmentationClassAug.zip?dl=0”名称为SegmentationClassAug直接解压放到“VOCdevkit/VOC2012/”就完成了。

         VOC 本身数据为 图像* .jpg   label为*.png

 

二、其他数据集还在更新中

在使用torchvision加载数据集进行图像分割任务时,你通常会按照以下步骤操作: 1. 导入必要的库: ```python import torchvision import torchvision.transforms as transforms from torchvision import datasets ``` 2. 选择合适的分割数据集,torchvision提供了一些常用的数据集,如CIFAR10等。不过,对于复杂的图像分割任务,常用的是Cityscapes、PASCAL VOC等数据集,这些数据集可能需要单独下载。 3. 定义数据预处理: 数据预处理包括对输入图像的转换操作,如缩放、裁剪、归一化等。 ```python transform = transforms.Compose([ transforms.Resize((256, 256)), # 调整图像大小 transforms.ToTensor(), # 将图片转换为Tensor transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) # 归一化 ]) ``` 4. 创建数据加载器: 使用`torchvision.datasets.ImageFolder`或其他自定义数据加载器来创建训练集和测试集。 ```python train_dataset = datasets.ImageFolder(root='path_to_train_data', transform=transform) test_dataset = datasets.ImageFolder(root='path_to_test_data', transform=transform) train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=batch_size, shuffle=True) test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=batch_size, shuffle=False) ``` 5. 在训练过程使用这些数据加载器: ```python for images, labels in train_loader: # 这里执行你的图像分割算法和训练过程 ``` 请注意,标准的torchvision数据集不直接支持像素级的标签分割,因此对于真正的图像分割任务,你可能需要使用专门的数据集,并可能需要自定义数据加载器来处理像素级别的标注。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值