制作自己的图像语义分割数据集

最新推荐文章于 2024-08-05 11:30:43 发布

这个名字真好听

最新推荐文章于 2024-08-05 11:30:43 发布

阅读量1.2w

点赞数 2

文章标签：深度学习图像语义分割

本文链接：https://blog.csdn.net/weixin_40428368/article/details/80979016

版权

本文教你如何正确制作自己的图像语义分割数据集。假设我当前目录下有500张图片，命名从1.jpg开始，一直往上递增，我事先已经调整好了图像的大小。

首先下载Labelme工具：https://github.com/wkentaro/labelme。使用方式见教程。

每张图片都会生成对应的json文件。接下里就是解析json文件。以第一个样本为例，解析json文件时，在命令行输入以下进行转化：

$labelme_json_to_dataset json/1.json -o parsed/json-1

（上面这一句中：json文件夹是存放json文件的地方，parsed文件夹是存放解析之后文件的地方）。通过刚刚这个命令，你可以在json-1子文件夹里找到5个文件，分别为：img.png/info.yaml/label.png/label_names.txt/label_viz.png。其中label.png和label_names.txt是后面将要用到的。

但是刚刚这条语句只会转化一个json文件，因此需要写一个shell脚本进行批文件处理。在工作目录中写一个shell脚本文件，命名为test.sh,文件里的内容如下：

for ((i=1;i<501;i++));do
  labelme_json_to_dataset json/$i.json -o parsed/json-$i
done

接下来需要在命令行里运行：

$sh test.sh

注意，上面的命令可能会报如下的错误：

Syntax error: Bad for loop variable

这个问题的解决方法如下,在命令行输入：

$chmod 777 test.sh

然后在终端运行：

$./test.sh

最后在parsed文件夹下成功生成了500个子文件夹。接下来为标注出来的label.png进行着色。现在需要写一个程序进行批量处理那500张label.png，新建一个python程序，命名为test.py，内容如下：

#-*- coding:utf-8 -*-

import PIL.Image
import numpy as np
from skimage import io,data,color
import matplotlib.pyplot as plt

for i in range(1,501):
    
    img=PIL.Image.open("parsed/json-%i/label.png"%i)
    img=np.array(img)
    dst=color.label2rgb(img,bg_label=0,bg_color=(0,0,0))#背景的标签为0，颜色为黑色。当你需要分割多个类别时，去skimage查看原函数
    io.imsave("transform/dstlabel-%i.png"%i,dst)

最后处理的500张图片保存在transform文件夹下，你可以查看到。但是，事情还没有结束！！！

最后一步，需要把刚刚的24位png图转化为8位png图，必须得转化。这里提供一份Matlab程序：

dirs=dir('C:/Users/xxx/Desktop/testing/transform/*.png');
for n=1:numel(dirs)
     strname=strcat('C:/Users/xxx/Desktop/testing/transform/',dirs(n).name);
     img=imread(strname);
     [x,map]=rgb2ind(img,256);
     newname=strcat('C:/Users/xxx/Desktop/testing/output/',dirs(n).name);
     imwrite(x,map,newname,'png');
end

最后在output文件夹下，生成最后的图像标签。接着就可以训练了。展示一组原图以及对应的标签：