扩充函数:
cv2.copyMakeBorder(img,top,bottom,left,right,mode)
填充图像边界的两种方法,也就是mode取值:
- BORDER_CONSTANT: 使用常数填充边界 (i.e. 黑色或者 )
- BORDER_REPLICATE: 复制原图中边界的行或者列。
- BORDER_REFLECT:复制边界区域的多行、多列像素
1.安照边界区域的像素翻折进行扩充
cv2.copyMakeBorder(img,50,50,50,50,cv2.BORDER_REPLICATE)
扩充结果:
2.常数填充
cv2.copyMakeBorder(img,50,50,50,50,cv2.BORDER_CONSTANT,value=[0,255,0])
3.根据图像的边界的像素值,向外扩充图片
在训练卷积网络时,经常需要对数据进行增强来提升模型的精度,下面使用扩充的办法可以对数据进行增强
标注的图片
下面对图片进行填充,但是注意每个文本都有标注框,扩充后需要对相应的标注框进行截断,还需要考虑角度问题,扩充后的效果如下:
cv2.copyMakeBorder(img,50,50,50,50,cv2.BORDER_REPLICATE)
假设扩充后的图片shape=(M,M,3),pt=np.array(shape=(4,2),np.uint8)
计算直线的斜率: k = (pt[1][1] - pt[0][1]) / (pt[1][0] - pt[0][0])
计算边界坐标:y = k*M + pt[1][1]-k1*pt[1][0]
通过这种方式进行扩充数据来对训练集进行数据增强,比较节省成本,尤其是文字比较少的情况下进行扩充能增加样本的复杂度