要训练自己的网络首先就要搞一个自己的数据集。我是找了一个只包含原始图片和标签文件的LoveDA数据集,想把它搞成VOC格式的数据集,以便匹配github上下载的代码。在创建过程中我发现,做语义分割不需要满足VOC官方格式的所有文件夹,只需要一部分即可。
官方VOC2012文件夹结构如上图所示,而语义分割只需要建立第2、3、4个文件夹(ImageSets,JPEGImage,SegmentationClass)即可,不需要创建Annotations文件夹,所以也不需要创建这个文件夹里的下命xml文件,我就是卡在这里了,搞了很久生成xml文件的代码,最后发现语义分割不需要,貌似目标检测才需要xml文件。
所以语义分割VOC数据集只需要有三个文件夹即可:
ImageSets:里面放图片对应的文件名txt文件
JPEGImages:里面放所有原始图像
SegmentationClass:里面放所有的标签图像