SSD 数据增强，VOC

最新推荐文章于 2024-02-29 21:14:50 发布

jack_201316888

最新推荐文章于 2024-02-29 21:14:50 发布

阅读量458

点赞数

分类专栏： AI

原文链接：https://blog.csdn.net/Xinyu_cheng/article/details/89321196

版权

AI 专栏收录该内容

135 篇文章 5 订阅

订阅专栏

前言

最近在做钢筋检测的比赛，因为比赛提供的数据只有200多张，而要使用神经网络模型来完成这个任务的话，这样的数据集就显得非常不足了，因而当我们要训练一个神经网络模型时，数据增强就变成了一种非常有必要的手段了，数据增强一般非为两种方式：一类是离线增强，一类是在线增强。

    离线增强：直接对数据集进行处理，数据的数目会变成增强因子 x 原数据集的数目，这种方法常常用于数据集很小的时候
    在线增强：这种增强的方法用于，获得 batch 数据之后，然后对这个 batch
    的数据进行增强，如旋转、平移、翻折等相应的变化，由于有些数据集不能接受线性级别的增长，这种方法长用于大的数据集，很多机器学习框架已经支持了这种数据增强方式，并且可以使用
    GPU 优化计算。

本篇博客我也将具体讲一下这两种方式的具体使用。本次主要做的是VOC2007数据格式的数据增强，使用的数据库主要是imaug，imgaug是一个用于机器学习实验中图像增强的python库，支持python2.7和3.4以上的版本。它支持多种增强技术，允许轻松组合这些技术，具有简单但功能强大的随机界面，可以在这些界面上增加图像和关键点/界标，并在后台进程中提供增强功能以提高性能。
1.离线增强

代码地址：https://github.com/xinyu-ch/Data-Augment
读取xml原始坐标

def read_xml_annotation(root, image_id):

   in_file = open(os.path.join(root, image_id))
   tree = ET.parse(in_file)
   root = tree.getroot()
   bndboxlist = []

   for object in root.findall('object'): # 找到root节点下的所有country节点
        bndbox = object.find('bndbox') # 子节点下节点rank的值

        xmin = int(bndbox.find('xmin').text)
        xmax = int(bndbox.find('xmax').text)
        ymin = int(bndbox.find('ymin').text)
        ymax = int(bndbox.find('ymax').text)
        # print(xmin,ymin,xmax,ymax)
        bndboxlist.append([xmin, ymin, xmax, ymax])
        # print(bndboxlist)

   bndbox = root.find('object').find('bndbox')
return bndboxlist

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20

生成变换序列产生一个处理图片的Sequential

# 影像增强
seq = iaa.Sequential([
    iaa.Flipud(0.5), # vertically flip 20% of all images
    iaa.Fliplr(0.5), # 镜像
    iaa.Multiply((1.2, 1.5)), # change brightness, doesn't affect BBs
    iaa.GaussianBlur(sigma=(0, 3.0)), # iaa.GaussianBlur(0.5),
    iaa.Affine(
        translate_px={"x": 15, "y": 15},
        scale=(0.8, 0.95),
        rotate=(-30, 30)
    ) # translate by 40/60px on x/y axis, and scale to 50-70%, affects BBs
])

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12

bounding box变化后坐标计算

先读取该影像对应xml文件，获取所有目标的bounding boxes，然后依次计算每个box变化后的坐标，图像坐标同步改变。

seq_det = seq.to_deterministic() # 保持坐标和图像同步改变，而不是随机
# 读取图片
img = Image.open(os.path.join(IMG_DIR, name[:-4] + '.jpg'))
# sp = img.size
img = np.asarray(img)
# bndbox 坐标增强
for i in range(len(bndbox)):
    bbs = ia.BoundingBoxesOnImage([
        ia.BoundingBox(x1=bndbox[i][0], y1=bndbox[i][1], x2=bndbox[i][2], y2=bndbox[i][3]),
    ], shape=img.shape)

bbs_aug = seq_det.augment_bounding_boxes([bbs])[0]
boxes_img_aug_list.append(bbs_aug)

    # 此处运用了一个max，一个min （max是为了方式变化后的box小于1，min是为了防止变化后的box的坐标超出图片，在做faster r-cnn训练的时候，box的坐标会减1，若坐标小于1,就会报错，当然超出图像范围也会报错）
    n_x1 = int(max(1, min(img.shape[1], bbs_aug.bounding_boxes[0].x1)))
    n_y1 = int(max(1, min(img.shape[0], bbs_aug.bounding_boxes[0].y1)))
    n_x2 = int(max(1, min(img.shape[1], bbs_aug.bounding_boxes[0].x2)))
    n_y2 = int(max(1, min(img.shape[0], bbs_aug.bounding_boxes[0].y2)))
    if n_x1 == 1 and n_x1 == n_x2:
        n_x2 += 1
    if n_y1 == 1 and n_y2 == n_y1:
        n_y2 += 1
    if n_x1 >= n_x2 or n_y1 >= n_y2:
        print('error', name)
    new_bndbox_list.append([n_x1, n_y1, n_x2, n_y2])
# 存储变化后的图片
image_aug = seq_det.augment_images([img])[0]
path = os.path.join(AUG_IMG_DIR,
                    str("%06d" % (len(files) + int(name[:-4]) + epoch * 250)) + '.jpg')
image_auged = bbs.draw_on_image(image_aug, thickness=0)
Image.fromarray(image_auged).save(path)

# 存储变化后的XML--此处可根据需要更改文件具体的名称
change_xml_list_annotation(XML_DIR, name[:-4], new_bndbox_list, AUG_XML_DIR,
len(files) + int(name[:-4]) + epoch * 250)
print(str("%06d" % (len(files) + int(name[:-4]) + epoch * 250)) + '.jpg')
new_bndbox_list = []

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38

Bounding Boxes保存

读取xml文件并使用ElementTree对xml文件进行解析，找到每个object的坐标值。

def change_xml_annotation(root, image_id, new_target):
    new_xmin = new_target[0]
    new_ymin = new_target[1]
    new_xmax = new_target[2]
    new_ymax = new_target[3]

    in_file = open(os.path.join(root, str(image_id) + '.xml')) # 这里root分别由两个意思
    tree = ET.parse(in_file)
    xmlroot = tree.getroot()
    object = xmlroot.find('object')
    bndbox = object.find('bndbox')
    xmin = bndbox.find('xmin')
    xmin.text = str(new_xmin)
    ymin = bndbox.find('ymin')
    ymin.text = str(new_ymin)
    xmax = bndbox.find('xmax')
    xmax.text = str(new_xmax)
    ymax = bndbox.find('ymax')
    ymax.text = str(new_ymax)
    tree.write(os.path.join(root, str("%06d" % (str(id) + '.xml'))))

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20

使用示例

数据准备输入数据为两个文件夹一个是需要增强的影像数据（JPEGImages），一个是对应的xml文件（Annotations）。注意：影像文件名需和xml文件名相对应！
————————————————
版权声明：本文为CSDN博主「Xinyu_cheng」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/Xinyu_cheng/article/details/89321196

jack_201316888

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
SSD 数据增强，VOC

前言最近在做钢筋检测的比赛，因为比赛提供的数据只有200多张，而要使用神经网络模型来完成这个任务的话，这样的数据集就显得非常不足了，因而当我们要训练一个神经网络模型时，数据增强就变成了一种非常有必要的手段了，数据增强一般非为两种方式：一类是离线增强，一类是在线增强。离线增强：直接对数据集进行处理，数据的数目会变成增强因子 x 原数据集的数目，这种方法常常用于数据集很小的时候在线增强：这种增强的方法用于，获得 batch 数据之后，然后对这个 batch 的数据进行...
复制链接

扫一扫

专栏目录