一、几何变换–仿射变换、透射变换
1.仿射变换
(1)概念
图像的仿射变换涉及到图像的形状位置角度的变化,是深度学习预处理中常到的功能,仿射变换主要是对图像的缩放,旋转,翻转和平移等操作的组合。
(2)仿射变换理解:
那什么是图像的仿射变换,如下图所示,图1中的点1, 2 和 3 与图二中三个点一一映射, 仍然形成三角形, 但形状已经大大改变,通过这样两组三点(感兴趣点)求出仿射变换, 接下来我们就能把仿射变换应用到图像中所有的点中,就完成了图像的仿射变换。
代码:
import numpy as np
import matplotlib.pyplot as plt
import cv2 as cv
# 读取图片
img = cv.imread("./image/yangzi.jpg")
plt.imshow(img[:,:,::-1])
# 仿射变换
rows,cols = img.shape[:2]
# 仿射变换矩阵
# [[50,50],[200,50],[50,200]]:在原图上找三点构成矩阵
# [100,100],[200,50],[100,250]:仿射后的图的三点坐标构成矩阵
pts1 = np.float32([[50,50],[200,50],[50,200]])
pts2 = np.float32([[100,100],[200,50],[100,250]])
# 仿射的矩阵
M = cv.getAffineTransform(pts1,pts2)
# 完成仿射变换
dst = cv.warpAffine(img,M,(cols,rows))
plt.imshow(dst)
2.透射变换
(1)理解:
透射变换是视角变化的结果,是指利用透视中心、像点、目标点三点共线的条件,按透视旋转定律使承影面(透视面)绕迹线(透视轴)旋转某一角度,破坏原有的投影光线束,仍能保持承影面上投影几何图形不变的变换。
代码示例:
import numpy as np
import matplotlib.pyplot as plt
import cv2 as cv
# 读图
img = cv.imread("./image/yangzi.jpg")
plt.imshow(img[:,:,::-1])
# 透射变换
# 获取行列
rows,cols = img.shape[:2]
# 创建变换矩阵
pts1 = np.float32([[56,65],[368,52],[28,387],[389,390]])
pts2 = np.float32([[100,165],[300,152],[128,220],[345,233]])
# 创建变换矩阵
T = cv.getPerspectiveTransform(pts1,pts2)
dst = cv.warpPerspective(img,T,(cols,rows))
plt.imshow(dst[:,:,::-1])
3.图像金字塔
(1)理解:
图像金字塔是图像多尺度表达的一种,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构。
图像金字塔用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。
金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似,层级越高,图像越小,分辨率越低。
(2)API
cv.pyrUp(img) #对图像进行上采样
cv.pyrDown(img) #对图像进行下采样
代码:
import matplotlib.pyplot as plt
import numpy as np
import cv2 as cv
img = cv.imread("./image/yangzi.jpg")
plt.imshow(img[