数据集增强方法
-
1、图片缩放
图像缩放便是调节图片的分辨率,可利用opencv-python库resize()函数对图片分辨率进行调节,在实际调节过程中,我们应保持在一定范围内,可根据实验反馈效果进行调整。 -
2、图片旋转
图像按照给定的角度旋转,可使用opencv-python中getRotationMatrix2D()函数和warpAffine()函数。示例代码:height, width = img.shape[:2] M = cv2.getRotationMatrix2D((width/2, height/2), self.angle, 1) return cv2.warpAffine(img, M, (width, height))
-
3、图片平移
将图像往x、y方向上按指定的数量移动像素,可使用cv2.warpAffine()函数,自定义平移的方向和位移大小,示例代码:height, width = img.shape[:2] trans_M = np.float32([[1, 0, self.x_trans], [0, 1, self.y_trans]]) return cv2.warpAffine(img, trans_M, (width, height))
-
4、图片模糊
常见方法如高斯模糊,可使用的是opencv-python中cv2.GaussianBlur()函数。 -
5、图片添加噪音
可以添加多种类型噪音,如椒盐噪音、高斯噪音,如常见的高斯噪音,使用skimage.util.random_noise()函数。
目标检测数据增强方法
方法1:详情点击
方法2:详情点击,对应github链接:github链接
方法3:详情点击
方法4:详情点击,对应github链接:github链接,论文链接:1906.11172
手写OCR图像数据增强方法
方法:详情点击