仿射变换和透视变换矩阵的参数含义与区别

最新推荐文章于 2025-03-05 10:47:54 发布

liangbaqiang

最新推荐文章于 2025-03-05 10:47:54 发布

阅读量1.3w

点赞数 72

分类专栏：图像变换

本文链接：https://blog.csdn.net/qq_36523492/article/details/109723705

版权

图像变换专栏收录该内容

5 篇文章

订阅专栏

从直观的角度看，仿射变换和透视变换的最大区别是：一个平行四边形，经过仿射变换后依然是平行四边形；而经过透视变换后只是一个四边形（不再平行了）。

仿射变换

在这里插入图片描述
仿射变换是把一个二维坐标系转换到另一个二维坐标系的过程，转换过程坐标点的相对位置和属性不发生变换，是一个线性变换，该过程只发生旋转和平移过程。因此，一个平行四边形经过仿射变换后还是一个平行四边形。
所以，仿射= 旋转 + 平移
仿射变换矩阵为：
在这里插入图片描述
其中，(x,y)是原图坐标，(x’,y’)是变换后的坐标；m11,m12,m21,m22为旋转量，m13,m23为平移量。所以仿射变换矩阵实际为2*3的矩阵，以上只是齐次性，为了方便简洁表达旋转和平移，因此，仿射变换为线性变换。

在opencv中，实现仿射变换的函数为:

warpAffine(src,dst,M,(cols,rows))
src:输入图像
dst:输出图像
M:2*3的仿射变换矩阵
(cols,rows):输出图像的行数和列数

以下用python编程语言，opencv函数库简单实现一下仿射变换，以下程序实现把一张图片顺时针旋转45°，向左平移200个像素点，向下平移30个像素点，该过程的仿射变换矩阵为：
在这里插入图片描述

import cv2 as cv
import numpy as np

src = cv.imread("Google.jpg")
rows,cols = src.shape[0:2]
M = np.array([[np.cos(np.pi/4),np.sin(-np.pi/4),500],[np.sin(np.pi/4),np.cos(np.pi/4),30]]) #顺时针旋转45度，向左平移200，向下平移30
dst = cv.warpAffine(src,M,(2*cols, 2*rows))#把输出图像的大小改为输入图像的两倍
cv.imshow("src",src)
cv.imshow("dst",dst)
cv.imwrite("affine.jpg", dst)
cv.waitKey(0)

输入图像src:
在这里插入图片描述
输出图片dst:

在这里插入图片描述

透视变换

在这里插入图片描述
透视变换是把一个图像投影到一个新的视平面的过程，该过程包括：把一个二维坐标系转换为三维坐标系，然后把三维坐标系投影到新的二维坐标系。该过程是一个非线性变换过程，因此，一个平行四边形经过透视变换后只得到四边形，但不平行。
透视变换矩阵为：
在这里插入图片描述
其中，(x,y)是原图坐标，(x’,y’)是变换后的坐标；m11,m12,m21,m22,m31,m32为旋转量，m13,m23,m33为平移量。因为透视变换是非线性的，所以不能齐次性表示；透视变换矩阵为3*3。

在opencv中，实现透视变换的函数为：

warpPerspective(src,dst,H,(cols,rows))
src:输入图像
dst:输出图像
H:3*3的仿射变换矩阵
(cols,rows):输出图像的行数和列数

程序实现跟仿射变换差不多，这里不再展示。

总结

仿射变换常用于旋转和平移等图像处理操作，原理较简单。而透视变换的实际应用较大，如视角纠正，全景拼接等。

单应性Homograph估计：从传统算法到深度学习

单应性原理被广泛应用于图像配准，全景拼接，机器人定位SLAM，AR增强现实等领域。这篇文章从基础图像坐标知识系为起点，讲解图像变换与坐标系的关系，介绍单应性矩阵计算方法，并分析深度学习在单应性方向的进展。

本文为入门级文章，希望能够帮助读者快速了解相关内容。

目录
一图像变换与平面坐标系的关系
二平面坐标系与齐次坐标系
三单应性变换
四深度学习在单应性方向的进展

单应性估计在图像拼接中的应用

一图像变换与平面坐标系的关系

旋转：

将图形围绕原点 [公式] 逆时针方向旋转角，用解析式表示为：

写成矩阵乘法形式：

平移：

但是现在遇到困难了，平移无法写成和上面旋转一样的矩阵乘法形式。所以引入齐次坐标 [公式] ，再写成矩阵形式：

其中 [公式] 表示单位矩阵，而表示平移向量。

那么就可以把把旋转和平移统一写在一个矩阵乘法公式中，即刚体变换：

而旋转矩阵 [公式] 是正交矩阵（）。

仿射变换

其中 [公式] 可以是任意2x2矩阵（与一定是正交矩阵不同）。

可以看到，相比刚体变换（旋转和平移），仿射变换除了改变目标位置，还改变目标的形状，但是会保持物体的“平直性”。

不同 [公式] 和矩阵对应的各种基本仿射变换：

投影变换（单应性变换）

简单说，投影变换彻底改变目标的形状。

总结一下：

刚体变换：平移+旋转，只改变物体位置，不改变物体形状
仿射变换：改变物体位置和形状，但是保持“平直性”
投影变换：彻底改变物体位置和形状

我们来看看完整投影变换矩阵各个参数的物理含义：

其中 [公式] 代表仿射变换参数，代表平移变换参数。

而 [公式] 表示一种“变换后边缘交点“关系，如：

至于 [公式] 则是一个与相关的缩放因子。

一般情况下都会通过归一化使得 [公式] （原因见下文）。

二平面坐标系与齐次坐标系

问题来了，齐次坐标到底是什么？

齐次坐标系 [公式] 与常见的三维空间坐标系不同，只有两个自由度：

而 [公式] （其中）对应坐标和的缩放尺度。当时：

特别的当 [公式] 时，对应无穷远：

三单应性变换

单应性是什么？

此处不经证明的给出：用 [无镜头畸变] 的相机从不同位置拍摄 [同一平面物体] 的图像之间存在单应性，可以用 [投影变换] 表示。

注意：单应性成立是有条件的！

简单说就是：

其中 [公式] 是Left view图片上的点，是Right view图片上对应的点。

那么这个单应性矩阵如何求解呢？

从更一般的情况分析，每一组匹配点 [公式] 有等式（15）成立：

由平面坐标与齐次坐标对应关系 [公式] ，上式可以表示为：

进一步变换为：

写成矩阵 [公式] 形式：

也就是说一组匹配点 [公式] 可以获得2组方程。

单应性矩阵8自由度

注意观察：单应性矩阵 [公式] 与其实完全一样（其中），例如：

即点 [公式] 无论经过还是映射，变化后都是。

如果使 [公式] ，那么有:

所以单应性矩阵 [公式] 虽然有9个未知数，但只有8个自由度。

在求 [公式] 时一般添加约束（也有用约束），所以还有共8个未知数。由于一组匹配点对应2组方程，那么只需要组不共线的匹配点即可求解的唯一解。

OpenCV已经提供了相关API，代码和变换结果如下。

import cv2
import numpy as np

im1 = cv2.imread(‘left.jpg’)
im2 = cv2.imread(‘right.jpg’)

src_points = np.array([[581, 297], [1053, 173], [1041, 895], [558, 827]])
dst_points = np.array([[571, 257], [963, 333], [965, 801], [557, 827]])

H, _ = cv2.findHomography(src_points, dst_points)

h, w = im2.shape[:2]

im2_warp = cv2.warpPerspective(im2, H, (w, h))

可以看到：

红框所在平面上内容基本对齐，但受到镜头畸变影响无法完全对齐；
平面外背景物体不符合单应性原理，偏离很大，完全无法对齐。

传统方法估计单应性矩阵

一般传统方法估计单应性变换矩阵，需要经过以下4个步骤：

提取每张图SIFT/SURF/FAST/ORB等特征点
提取每个特征点对应的描述子
通过匹配特征点描述子，找到两张图中匹配的特征点对（这里可能存在错误匹配）
使用RANSAC算法剔除错误匹配
求解方程组，计算Homograph单应性变换矩阵

示例代码如下：

#coding:utf-8
# This code only tested in OpenCV 3.4.2!
import cv2
import numpy as np

# 读取图片
im1 = cv2.imread(‘left.jpg’)
im2 = cv2.imread(‘right.jpg’)

# 计算SURF特征点和对应的描述子，kp存储特征点坐标，des存储对应描述子
surf = cv2.xfeatures2d.SURF_create()
kp1, des1 = surf.detectAndCompute(im1, None)
kp2, des2 = surf.detectAndCompute(im2, None)

# 匹配特征点描述子
bf = cv2.BFMatcher()
matches = bf.knnMatch(des1, des2, k=2)

# 提取匹配较好的特征点
good = []
for m,n in matches:
if m.distance < 0.7*n.distance:
good.append(m)

# 通过特征点坐标计算单应性矩阵H
# （findHomography中使用了RANSAC算法剔初错误匹配）
src_pts = np.float32([kp1[m.queryIdx].pt for m in good]).reshape(-1,1,2)
dst_pts = np.float32([kp2[m.trainIdx].pt for m in good]).reshape(-1,1,2)
H, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)
matchesMask = mask.ravel().tolist()

# 使用单应性矩阵计算变换结果并绘图
h, w, d = im1.shape
pts = np.float32([[0,0], [0,h-1], [w-1,h-1], [w-1,0]]).reshape(-1,1,2)
dst = cv2.perspectiveTransform(pts, H)
img2 = cv2.polylines(im2, [np.int32(dst)], True, 255, 3, cv2.LINE_AA)

draw_params = dict(matchColor = (0,255,0), # draw matches in green color
singlePointColor = None,
matchesMask = matchesMask, # draw only inliers
flags = 2)

im3 = cv2.drawMatches(im1, kp1, im2, kp2, good, None, **draw_params)