本文通过opencv对数据进行处理,可以将数据集扩展4倍大小。分别是旋转、镜像、调低亮度对比、增加高斯噪声。
代码如下:
ps:如果不需要对数据集进行统一大小处理可以直接用以下代码
import cv2
import os
import numpy as np
def rotate(image, path_out_rotate):
rows, cols = image.shape[:2]
M = cv2.getRotationMatrix2D((cols / 2, rows / 2), 10, 1)
dst = cv2.warpAffine(image, M, (cols, rows))
cv2.imwrite(path_out_rotate, dst)
def shear(image, path_out_shear):
'''
剪切
'''
height, width = image.shape[:2]
cropped = image[int(height / 40):height, int(width / 40):width]
cv2.imwrite(path_out_shear, cropped)
def mirror(image, path_out_mirror):
'''
水平镜像
'''
h_flip = cv2.flip(image, 1)
cv2.imwrite(path_out_mirror, h_flip)
def contrast_brightness_image(src1, a, g, path_out):
'''
色彩增强(通过调节对比度和亮度)
'''
h, w, ch = src1.shape # 获取shape的数值,height和width、通道
# 新建全零图片数组src2,将height和width,类型设置为原图片的通道类型(色素全为零,输出为全黑图片)
src2 = np.zeros([h, w, ch], src1.dtype)
# addWeighted函数说明:计算两个图像阵列的加权和
dst = cv2.addWeighted(src1, a, src2, 1 - a, g)
cv2.imwrite(path_out, dst)
def gasuss_noise(image, path_out_gasuss, mean=0, var=0.0001):
'''
添加高斯噪声
mean : 均值
var : 方差
'''
image = np.array(image / 255, dtype=float)
noise = np.random.normal(mean, var ** 0.5, image.shape)
out = image + noise
if out.min() < 0:
low_clip = -1.
else:
low_clip = 0.
out = np.clip(out, low_clip, 1.0)
out = np.uint8(out * 255)
cv2.imwrite(path_out_gasuss, out)
class picture_change():
def __init__(self, size, original_img_dir, new_img_dir):
self.size = size
self.img = original_img_dir
self.new_dir = new_img_dir
def resize(self):
pciture_id = os.listdir(self.img)
index = 0
for i in pciture_id:
index = index + 1
pciture_add = os.path.join(self.img, i)
img = cv2.imread(pciture_add)
new_img = cv2.resize(img, dsize=(self.size, self.size))
new_img_dir = os.path.join(self.new_dir, "new_size_%06d.jpg" % index)
cv2.imwrite(new_img_dir, new_img)
def rotate(self):
pciture_id = os.listdir(self.img)
index = 0
for i in pciture_id:
index = index + 1
pciture_add = os.path.join(self.img, i)
img = cv2.imread(pciture_add)
new_img_dir = os.path.join(self.new_dir, "rotate_img_%06d.jpg" % index)
rotate_img = rotate(img, new_img_dir)
return print('正在制作旋转数据集')
def mirror(self):
pciture_id = os.listdir(self.img)
index = 0
for i in pciture_id:
index = index + 1
pciture_add = os.path.join(self.img, i)
img = cv2.imread(pciture_add)
new_img_dir = os.path.join(self.new_dir, "mirror_img_%06d.jpg" % index)
mirror_img = mirror(img, new_img_dir)
return print('正在制作镜像数据集')
def dark(self):
pciture_id = os.listdir(self.img)
index = 0
for i in pciture_id:
index = index + 1
pciture_add = os.path.join(self.img, i)
img = cv2.imread(pciture_add)
new_img_dir = os.path.join(self.new_dir, "contrast_img_%06d.jpg" % index)
dark_img = contrast_brightness_image(img, 0.5, 3, new_img_dir)
return print('正在制作暗处里数据集')
def gasuss_noise(self):
pciture_id = os.listdir(self.img)
index = 0
for i in pciture_id:
index = index + 1
pciture_add = os.path.join(self.img, i)
img = cv2.imread(pciture_add)
new_img_dir = os.path.join(self.new_dir, "gasuss_noise_img_%06d.jpg" % index)
gasuss_img = gasuss_noise(img, new_img_dir)
return print('正在制作高斯数据集')
if __name__ == '__main__':
original_img_dir = r'B:\software\deeplearning\pytorch_project\yolov3\hyj666\changepicture\yyy'
new_img_dir = 'picture_over'
hyj = picture_change(416, original_img_dir, new_img_dir) # 416统一图片尺寸的大小
# hyj.resize() 如果要对原始数据进行数据统一大小尺寸用这个 把original_img_dir换成原始未处理的图片 new_img_dir换成新的空目录
hyj.rotate() # 不需要对数据统一大小那么original_img_dir换成原始未处理的图片 new_img_dir换成新的空目录 如果统一大小以后上面的original_img_dir就要换成处理后新的大小一致的新文件的地址 new_img_dir换成新的目录放处理后的图片
hyj.mirror()
hyj.dark()
hyj.gasuss_noise()
使用方法:首先创建两个空的文件夹A、B。A文件夹里放入需要处理的图片,B文件夹空的用来放程序处理后的图片。
这里的改动只需要将original_img_dir改成自己的A文件夹的目录,将new_img_dir改成自己B文件夹的目录运行即可,最后会在B文件夹中生成对应的图片。
ps:如果需要进行数据统一大小处理,再扩展数据可以进行以下操作。
import cv2
import os
import numpy as np
def rotate(image, path_out_rotate):
rows, cols = image.shape[:2]
M = cv2.getRotationMatrix2D((cols / 2, rows / 2), 10, 1)
dst = cv2.warpAffine(image, M, (cols, rows))
cv2.imwrite(path_out_rotate, dst)
def shear(image, path_out_shear):
'''
剪切
'''
height, width = image.shape[:2]
cropped = image[int(height / 40):height, int(width / 40):width]
cv2.imwrite(path_out_shear, cropped)
def mirror(image, path_out_mirror):
'''
水平镜像
'''
h_flip = cv2.flip(image, 1)
cv2.imwrite(path_out_mirror, h_flip)
def contrast_brightness_image(src1, a, g, path_out):
'''
色彩增强(通过调节对比度和亮度)
'''
h, w, ch = src1.shape # 获取shape的数值,height和width、通道
# 新建全零图片数组src2,将height和width,类型设置为原图片的通道类型(色素全为零,输出为全黑图片)
src2 = np.zeros([h, w, ch], src1.dtype)
# addWeighted函数说明:计算两个图像阵列的加权和
dst = cv2.addWeighted(src1, a, src2, 1 - a, g)
cv2.imwrite(path_out, dst)
def gasuss_noise(image, path_out_gasuss, mean=0, var=0.0001):
'''
添加高斯噪声
mean : 均值
var : 方差
'''
image = np.array(image / 255, dtype=float)
noise = np.random.normal(mean, var ** 0.5, image.shape)
out = image + noise
if out.min() < 0:
low_clip = -1.
else:
low_clip = 0.
out = np.clip(out, low_clip, 1.0)
out = np.uint8(out * 255)
cv2.imwrite(path_out_gasuss, out)
class picture_change():
def __init__(self, size, original_img_dir, new_img_dir):
self.size = size
self.img = original_img_dir
self.new_dir = new_img_dir
def resize(self):
pciture_id = os.listdir(self.img)
index = 0
for i in pciture_id:
index = index + 1
pciture_add = os.path.join(self.img, i)
img = cv2.imread(pciture_add)
new_img = cv2.resize(img, dsize=(self.size, self.size))
new_img_dir = os.path.join(self.new_dir, "new_size_%06d.jpg" % index)
cv2.imwrite(new_img_dir, new_img)
def rotate(self):
pciture_id = os.listdir(self.img)
index = 0
for i in pciture_id:
index = index + 1
pciture_add = os.path.join(self.img, i)
img = cv2.imread(pciture_add)
new_img_dir = os.path.join(self.new_dir, "rotate_img_%06d.jpg" % index)
rotate_img = rotate(img, new_img_dir)
return print('正在制作旋转数据集')
def mirror(self):
pciture_id = os.listdir(self.img)
index = 0
for i in pciture_id:
index = index + 1
pciture_add = os.path.join(self.img, i)
img = cv2.imread(pciture_add)
new_img_dir = os.path.join(self.new_dir, "mirror_img_%06d.jpg" % index)
mirror_img = mirror(img, new_img_dir)
return print('正在制作镜像数据集')
def dark(self):
pciture_id = os.listdir(self.img)
index = 0
for i in pciture_id:
index = index + 1
pciture_add = os.path.join(self.img, i)
img = cv2.imread(pciture_add)
new_img_dir = os.path.join(self.new_dir, "contrast_img_%06d.jpg" % index)
dark_img = contrast_brightness_image(img, 0.5, 3, new_img_dir)
return print('正在制作暗处里数据集')
def gasuss_noise(self):
pciture_id = os.listdir(self.img)
index = 0
for i in pciture_id:
index = index + 1
pciture_add = os.path.join(self.img, i)
img = cv2.imread(pciture_add)
new_img_dir = os.path.join(self.new_dir, "gasuss_noise_img_%06d.jpg" % index)
gasuss_img = gasuss_noise(img, new_img_dir)
return print('正在制作高斯数据集')
if __name__ == '__main__':
original_img_dir = r'B:\software\deeplearning\pytorch_project\yolov3\hyj666\changepicture\yyy'
new_img_dir = 'picture_over'
hyj = picture_change(416, original_img_dir, new_img_dir) # 416统一图片尺寸的大小
hyj.resize() #如果要对原始数据进行数据统一大小尺寸用这个 把original_img_dir换成原始未处理的图片 new_img_dir换成新的空目录
#hyj.rotate() # 不需要对数据统一大小那么original_img_dir换成原始未处理的图片 new_img_dir换成新的空目录 如果统一大小以后上面的original_img_dir就要换成处理后新的大小一致的新文件的地址 new_img_dir换成新的目录放处理后的图片
#hyj.mirror()
#hyj.dark()
#hyj.gasuss_noise()
使用方法:首先将129行picture_change后面的416数字,改成自己需要的图片大小,输出图片是一个正方形比如这里是416*416大小的。
original_img_dir 目录改成自己存放原始图片的地址,new_img_dir改成空文件夹用来存放处理后统一大小的图片。
对图片进行扩展:再进行图片扩展的时候,我们首先将hyj.resize()给注释掉,跟上面处理不需要统一大小的数据一样.
接着修改目录,注意!这里修改的新的original_img_dir 应该是上面new_img_dir的地址,我们需要再创建一个新的文件夹用来存放处理后的数据,将新的文件夹的地址替换new_img_dir的地址.步骤就跟第一个一样。