参考依据
官方文档:
https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_imgproc/py_geometric_transformations/py_geometric_transformations.html#geometric-transformations
目标
- 学习不同的几何变换,比如图像的平移、旋转、仿射变换等
几何变换
OpenCV提供了两个变换函数:cv2.warpAffine和cv2.warpPerspective,其中warpAffine设置了2x3个转换矩阵(6个变换因子),而warpPerspective设置了3x3个转换矩阵(9个变换因子),一般的功能,warpAffine就足够了。
warpAffine(放射变换):
warpPerspective(透视变换):
具体API可参见:https://docs.opencv.org/2.4/modules/imgproc/doc/geometric_transformations.html?highlight=cv2.warpaffine#cv2.warpAffine
尺度缩放
主要使用cv2.resize()来进行尺度变换,即可以手动设置图像大小,也可以设置缩放比例。默认的插值方法为:cv.INTER_LINEAR,也有其他许多可选择的插值方法,如下:
一般来说,INTER_AREA适合用于缩小,INTER_LINEAR和INTER_CUBIC适合放大。
img = cv2.imread('UESTC.jpg') # shape [880, 880, 3]
# 方法1
res1 = cv2.resize(img, (110,110), interpolation=cv2.INTER_AREA)
# 方法2
res2 = cv2.resize(img, None, fx=1/8, fy=1/8, interpolation=cv2.INTER_AREA)
平移
平移就是位置的移动,假设现在要将图像移动在想,x,y方向(tx,ty)个像素点,使用cv2.warpAffine()就需要传入转换矩阵M(np.float32类型)为:
img = cv2.cvtColor(cv2.imread('UESTC.jpg'), cv2.COLOR_BGR2RGB)
rows, cols, channels = img.shape
M = np.float32([[1,0,100],[0,1,200]])
dst = cv2.warpAffine(img, M, (cols, rows))
plt.subplot(1,2,1), plt.imshow(img)
plt.subplot(1,2,2), plt.imshow(dst)
plt.show()
需要主要warpAffine第三个参数为输出图像的尺寸,为宽(cols)、长(rows)。
旋转
旋转主要也是通过平移来实现的,例如一张图像旋转了角度Θ,那么可以通过转换矩阵M来实现:
同时,OpenCV还提供了旋转时进行尺度缩放,并且可自由调整旋转中心,修改后的转换矩阵为:
当然,这个转换矩阵不需要人工进行计算,OpenCV为我们提供了对应的函数来求得矩阵M,cv2.getRotationMatrix2D(center, angle, scale),传入中心点、角度(逆时针)、缩放尺寸即可返回对应的旋转矩阵。
img = cv2.cvtColor(cv2.imread('UESTC.jpg'), cv2.COLOR_BGR2RGB)
rows, cols, channels = img.shape
M = cv2.getRotationMatrix2D((cols/2, rows/2), 90, 1)
dst = cv2.warpAffine(img, M, (cols, rows))
plt.subplot(1,2,1), plt.imshow(img)
plt.subplot(1,2,2), plt.imshow(dst)
plt.show()
三点求仿射变换
cv2.getAffineTransform(),可以根据原图像和目标图像所对应的三个点,求它们放射转换所需要的转换矩阵M。
P.S. 仿射变换前后,在原图中平行的线,变换后仍平行
img = cv2.cvtColor(cv2.imread('UESTC.jpg'), cv2.COLOR_BGR2RGB)
rows, cols, channels = img.shape
pt1 = np.float32([[50,50],[200,50],[50,200]])
img = cv2.circle(img,(50,50),20,color=(0,255,0),thickness=-1)
img = cv2.circle(img,(200,50),20,color=(0,255,0),thickness=-1)
img = cv2.circle(img,(50,200),20,color=(0,255,0),thickness=-1)
pt2 = np.float32([[10,100],[200,50],[100,250]])
M = cv2.getAffineTransform(pt1, pt2)
dst = cv2.warpAffine(img, M, (cols, rows))
plt.subplot(1,2,1), plt.imshow(img)
plt.subplot(1,2,2), plt.imshow(dst)
plt.show()
其中绿点为对应的坐标点集
四点求透视变换
cv2.getPerspectiveTransform(),可以根据原图像和目标图像所对应的四个点,求它们放射转换所需要的转换矩阵M。
P.S. 直线透视变换后仍为直线
img = cv2.imread('sudokusmall.png')
rows,cols,ch = img.shape
pts1 = np.float32([[56,65],[368,52],[28,387],[389,390]])
pts2 = np.float32([[0,0],[300,0],[0,300],[300,300]])
M = cv2.getPerspectiveTransform(pts1,pts2)
dst = cv2.warpPerspective(img,M,(300,300))
plt.subplot(121),plt.imshow(img),plt.title('Input')
plt.subplot(122),plt.imshow(dst),plt.title('Output')
plt.show()
上图为参考链接中的图。