1、为何要增广数据集呢? VOC 格式
因为我们平时自己用来训练的数据集需要自己制作。公共数据集无法满足自己的针对性需求。
2、增广的方法有哪些?
水平翻转增强,垂直翻转增强,镜像对称增强,仿射变化,旋转,高斯加噪,对比度变化,尺度变换,平移等增强方法,
3、数据集格式?
第一种 文件或者文件夹代表标签,不需要对图像中的目标进行打标签。
第二种 通过打框来进行标注:缺点是 麻烦 工作量大。
办法一: 通过代码:
常用的几种 反转:
bmp = imread(filname);
I = fliplr(bmp);
平移:
bmp = imread(filename); %读入图片
se= translate(strel(1), [y, x]);
Img = imdilate(bmp, se);
旋转:
bmp = imread(filename);
I = imrotate(bmp, 10, 'bilinear', 'crop');
加噪声:
bmp = imread(filename);
I1 = imnoise(bmp, 'salt & pepper'); %椒盐噪声
w = [1 2 1; 2 4 2; 1 2 1];
I2 = imfilter(bmp, w, 'corr', 'replicate'); %高斯噪声
w = [1 1 1; 1 1 1; 1 1 1] / 9;
I3 = imfilter(bmp, w, 'corr', 'replicate'); %平均平滑
I4 = medfilt2(bmp, [3, 3]); %中值滤波
等等,,,,,这里不一一举例。
还有一种就是通过软件:直接扩充数据集,标签自动生成对齐。
2、数据集增强软件。
软件集成了水平翻转增强,垂直翻转增强,镜像对称增强,仿射变化,旋转,高斯加噪,对比度变化,尺度变换,平移一共8中增强方法,
图片变化的方式,自动生成并写入xml文件,十分方便)
软件作用: 扩大训练样本集来提高网络识别精度,减少人工标注工作量(因为已经可以自动产生label文件也就是xml文件了)
效果图如下:
需要软件的加我QQ:410834611(伸手党勿加)