使用Opencv进行数据集4倍扩充

最新推荐文章于 2023-04-29 10:05:40 发布

没有人辅导的研究生

最新推荐文章于 2023-04-29 10:05:40 发布

阅读量738

点赞数

文章标签： opencv 深度学习 pytorch 人工智能 Powered by 金山文档

本文链接：https://blog.csdn.net/hyj6668/article/details/129785986

版权

本文提供了一段Python代码，展示如何利用OpenCV库对图像进行旋转、镜像、调整亮度对比和添加高斯噪声等操作，从而扩展数据集的规模。代码包括了创建旋转、镜像、暗处、高斯噪声图像的函数，并封装在`picture_change`类中，方便对指定目录下的图片批量处理。通过这些方法，可以将数据集扩大4倍，有助于训练模型时提高其泛化能力。

摘要由CSDN通过智能技术生成

本文通过opencv对数据进行处理，可以将数据集扩展4倍大小。分别是旋转、镜像、调低亮度对比、增加高斯噪声。

代码如下：

ps：如果不需要对数据集进行统一大小处理可以直接用以下代码

import cv2
import os
import numpy as np


def rotate(image, path_out_rotate):
    rows, cols = image.shape[:2]
    M = cv2.getRotationMatrix2D((cols / 2, rows / 2), 10, 1)
    dst = cv2.warpAffine(image, M, (cols, rows))
    cv2.imwrite(path_out_rotate, dst)


def shear(image, path_out_shear):
    '''
        剪切
    '''
    height, width = image.shape[:2]
    cropped = image[int(height / 40):height, int(width / 40):width]
    cv2.imwrite(path_out_shear, cropped)


def mirror(image, path_out_mirror):
    '''
        水平镜像
    '''
    h_flip = cv2.flip(image, 1)
    cv2.imwrite(path_out_mirror, h_flip)


def contrast_brightness_image(src1, a, g, path_out):
    '''
        色彩增强（通过调节对比度和亮度）
    '''
    h, w, ch = src1.shape  # 获取shape的数值，height和width、通道
    # 新建全零图片数组src2,将height和width，类型设置为原图片的通道类型(色素全为零，输出为全黑图片)
    src2 = np.zeros([h, w, ch], src1.dtype)
    # addWeighted函数说明:计算两个图像阵列的加权和
    dst = cv2.addWeighted(src1, a, src2, 1 - a, g)
    cv2.imwrite(path_out, dst)


def gasuss_noise(image, path_out_gasuss, mean=0, var=0.0001):
    '''
        添加高斯噪声
        mean : 均值
        var : 方差
    '''
    image = np.array(image / 255, dtype=float)
    noise = np.random.normal(mean, var ** 0.5, image.shape)
    out = image + noise
    if out.min() < 0:
        low_clip = -1.
    else:
        low_clip = 0.
    out = np.clip(out, low_clip, 1.0)
    out = np.uint8(out * 255)
    cv2.imwrite(path_out_gasuss, out)






class picture_change():
    def __init__(self, size, original_img_dir, new_img_dir):
        self.size = size
        self.img = original_img_dir
        self.new_dir = new_img_dir

    def resize(self):
        pciture_id = os.listdir(self.img)
        index = 0
        for i in pciture_id:
            index = index + 1
            pciture_add = os.path.join(self.img, i)
            img = cv2.imread(pciture_add)
            new_img = cv2.resize(img, dsize=(self.size, self.size))
            new_img_dir = os.path.join(self.new_dir, "new_size_%06d.jpg" % index)
            cv2.imwrite(new_img_dir, new_img)

    def rotate(self):
        pciture_id = os.listdir(self.img)
        index = 0
        for i in pciture_id:
            index = index + 1
            pciture_add = os.path.join(self.img, i)
            img = cv2.imread(pciture_add)
            new_img_dir = os.path.join(self.new_dir, "rotate_img_%06d.jpg" % index)
            rotate_img = rotate(img, new_img_dir)
        return print('正在制作旋转数据集')

    def mirror(self):
        pciture_id = os.listdir(self.img)
        index = 0
        for i in pciture_id:
            index = index + 1
            pciture_add = os.path.join(self.img, i)
            img = cv2.imread(pciture_add)
            new_img_dir = os.path.join(self.new_dir, "mirror_img_%06d.jpg" % index)
            mirror_img = mirror(img, new_img_dir)
        return print('正在制作镜像数据集')

    def dark(self):
        pciture_id = os.listdir(self.img)
        index = 0
        for i in pciture_id:
            index = index + 1
            pciture_add = os.path.join(self.img, i)
            img = cv2.imread(pciture_add)
            new_img_dir = os.path.join(self.new_dir, "contrast_img_%06d.jpg" % index)
            dark_img = contrast_brightness_image(img, 0.5, 3, new_img_dir)
        return print('正在制作暗处里数据集')

    def gasuss_noise(self):
        pciture_id = os.listdir(self.img)
        index = 0
        for i in pciture_id:
            index = index + 1
            pciture_add = os.path.join(self.img, i)
            img = cv2.imread(pciture_add)
            new_img_dir = os.path.join(self.new_dir, "gasuss_noise_img_%06d.jpg" % index)
            gasuss_img = gasuss_noise(img, new_img_dir)
        return print('正在制作高斯数据集')


if __name__ == '__main__':
    original_img_dir = r'B:\software\deeplearning\pytorch_project\yolov3\hyj666\changepicture\yyy'
    new_img_dir = 'picture_over'
    hyj = picture_change(416, original_img_dir, new_img_dir)  # 416统一图片尺寸的大小
    # hyj.resize() 如果要对原始数据进行数据统一大小尺寸用这个 把original_img_dir换成原始未处理的图片 new_img_dir换成新的空目录
    hyj.rotate()  # 不需要对数据统一大小那么original_img_dir换成原始未处理的图片 new_img_dir换成新的空目录 如果统一大小以后上面的original_img_dir就要换成处理后新的大小一致的新文件的地址 new_img_dir换成新的目录放处理后的图片
    hyj.mirror()
    hyj.dark()
    hyj.gasuss_noise()

使用方法:首先创建两个空的文件夹A、B。A文件夹里放入需要处理的图片，B文件夹空的用来放程序处理后的图片。

这里的改动只需要将original_img_dir改成自己的A文件夹的目录，将new_img_dir改成自己B文件夹的目录运行即可，最后会在B文件夹中生成对应的图片。

ps：如果需要进行数据统一大小处理，再扩展数据可以进行以下操作。

import cv2
import os
import numpy as np


def rotate(image, path_out_rotate):
    rows, cols = image.shape[:2]
    M = cv2.getRotationMatrix2D((cols / 2, rows / 2), 10, 1)
    dst = cv2.warpAffine(image, M, (cols, rows))
    cv2.imwrite(path_out_rotate, dst)


def shear(image, path_out_shear):
    '''
        剪切
    '''
    height, width = image.shape[:2]
    cropped = image[int(height / 40):height, int(width / 40):width]
    cv2.imwrite(path_out_shear, cropped)


def mirror(image, path_out_mirror):
    '''
        水平镜像
    '''
    h_flip = cv2.flip(image, 1)
    cv2.imwrite(path_out_mirror, h_flip)


def contrast_brightness_image(src1, a, g, path_out):
    '''
        色彩增强（通过调节对比度和亮度）
    '''
    h, w, ch = src1.shape  # 获取shape的数值，height和width、通道
    # 新建全零图片数组src2,将height和width，类型设置为原图片的通道类型(色素全为零，输出为全黑图片)
    src2 = np.zeros([h, w, ch], src1.dtype)
    # addWeighted函数说明:计算两个图像阵列的加权和
    dst = cv2.addWeighted(src1, a, src2, 1 - a, g)
    cv2.imwrite(path_out, dst)


def gasuss_noise(image, path_out_gasuss, mean=0, var=0.0001):
    '''
        添加高斯噪声
        mean : 均值
        var : 方差
    '''
    image = np.array(image / 255, dtype=float)
    noise = np.random.normal(mean, var ** 0.5, image.shape)
    out = image + noise
    if out.min() < 0:
        low_clip = -1.
    else:
        low_clip = 0.
    out = np.clip(out, low_clip, 1.0)
    out = np.uint8(out * 255)
    cv2.imwrite(path_out_gasuss, out)






class picture_change():
    def __init__(self, size, original_img_dir, new_img_dir):
        self.size = size
        self.img = original_img_dir
        self.new_dir = new_img_dir

    def resize(self):
        pciture_id = os.listdir(self.img)
        index = 0
        for i in pciture_id:
            index = index + 1
            pciture_add = os.path.join(self.img, i)
            img = cv2.imread(pciture_add)
            new_img = cv2.resize(img, dsize=(self.size, self.size))
            new_img_dir = os.path.join(self.new_dir, "new_size_%06d.jpg" % index)
            cv2.imwrite(new_img_dir, new_img)

    def rotate(self):
        pciture_id = os.listdir(self.img)
        index = 0
        for i in pciture_id:
            index = index + 1
            pciture_add = os.path.join(self.img, i)
            img = cv2.imread(pciture_add)
            new_img_dir = os.path.join(self.new_dir, "rotate_img_%06d.jpg" % index)
            rotate_img = rotate(img, new_img_dir)
        return print('正在制作旋转数据集')

    def mirror(self):
        pciture_id = os.listdir(self.img)
        index = 0
        for i in pciture_id:
            index = index + 1
            pciture_add = os.path.join(self.img, i)
            img = cv2.imread(pciture_add)
            new_img_dir = os.path.join(self.new_dir, "mirror_img_%06d.jpg" % index)
            mirror_img = mirror(img, new_img_dir)
        return print('正在制作镜像数据集')

    def dark(self):
        pciture_id = os.listdir(self.img)
        index = 0
        for i in pciture_id:
            index = index + 1
            pciture_add = os.path.join(self.img, i)
            img = cv2.imread(pciture_add)
            new_img_dir = os.path.join(self.new_dir, "contrast_img_%06d.jpg" % index)
            dark_img = contrast_brightness_image(img, 0.5, 3, new_img_dir)
        return print('正在制作暗处里数据集')

    def gasuss_noise(self):
        pciture_id = os.listdir(self.img)
        index = 0
        for i in pciture_id:
            index = index + 1
            pciture_add = os.path.join(self.img, i)
            img = cv2.imread(pciture_add)
            new_img_dir = os.path.join(self.new_dir, "gasuss_noise_img_%06d.jpg" % index)
            gasuss_img = gasuss_noise(img, new_img_dir)
        return print('正在制作高斯数据集')


if __name__ == '__main__':
    original_img_dir = r'B:\software\deeplearning\pytorch_project\yolov3\hyj666\changepicture\yyy'
    new_img_dir = 'picture_over'
    hyj = picture_change(416, original_img_dir, new_img_dir)  # 416统一图片尺寸的大小
    hyj.resize() #如果要对原始数据进行数据统一大小尺寸用这个 把original_img_dir换成原始未处理的图片 new_img_dir换成新的空目录
    #hyj.rotate()  # 不需要对数据统一大小那么original_img_dir换成原始未处理的图片 new_img_dir换成新的空目录 如果统一大小以后上面的original_img_dir就要换成处理后新的大小一致的新文件的地址 new_img_dir换成新的目录放处理后的图片
    #hyj.mirror()
    #hyj.dark()
    #hyj.gasuss_noise()

使用方法：首先将129行picture_change后面的416数字，改成自己需要的图片大小，输出图片是一个正方形比如这里是416*416大小的。

original_img_dir 目录改成自己存放原始图片的地址，new_img_dir改成空文件夹用来存放处理后统一大小的图片。

对图片进行扩展：再进行图片扩展的时候，我们首先将hyj.resize()给注释掉，跟上面处理不需要统一大小的数据一样.

接着修改目录，注意！这里修改的新的original_img_dir 应该是上面new_img_dir的地址，我们需要再创建一个新的文件夹用来存放处理后的数据，将新的文件夹的地址替换new_img_dir的地址.步骤就跟第一个一样。