在恢复图像的过程中,可能会需要对透视畸变以及仿射变换进行补偿,今天整理了下关于透视畸变和仿射变换的相关概念。
首先讲仿射变换,仿射变换一种二维坐标到二维坐标之间的线性变换,保持二维图形的“平直性”(译注: straightness,即变换后直线还是直线不会打弯,圆弧还是圆弧)和“平行性”(译注:parallelness,其实是指保持二维图形间的相对位置关系不变,平行线还是平行线,而直线上点的位置顺序不变,另特别注意向量间夹角可能会发生变化。)仿射变换可以通过一系列的原子变换的复合来实现,包括:平移(Translation)、缩放(Scale)、翻转(Flip)、旋转(Rotation)和错切(Shear)。
常用的仿射变换:旋转、倾斜、平移、缩放,可以用一个3×3的矩阵来表示,其最后一行为(0, 0, 1)。该变换矩阵将原坐标(x, y)变换为新坐标(x', y'),这里原坐标和新坐标皆视为最末一行为(1)的三维列向量,原列向量左乘变换矩阵得到新的列向量:
平移变换,将每一点移动到(x+tx, y+ty),变换矩阵为:
[ 1 0 tx ]
[ 0 1 ty ]
[ 0 0 1 ]
(译注:平移变换是一种“
刚体变换”,rigid-body transformation,中学学过的物理,都知道啥叫“刚体”吧,就是不会产生形变的理想物体,平移当然不会改变二维图形的形状。同理,下面的“
旋转变换”也是刚体变换,而“缩放”、“错切”都是会改变图形形状的。)
public static AffineTransform getScaleInstance(double sx, double sy)
缩放变换,将每一点的横坐标放大(缩小)至sx倍,纵坐标放大(缩小)至sy倍,变换矩阵为:
[ sx 0 0 ]
[ 0 sy 0 ]
[ 0 0 1 ]
当sx=sy时,称为尺度缩放,sx不等于sy时,这就是我们平时所说的拉伸变换。
public static AffineTransform getShearInstance(double shx, double shy)
剪切变换,变换矩阵为:
[ 1 shx 0 ]
[ shy 1 0 ]
[ 0 0 1 ]
相当于一个横向剪切与一个纵向剪切的复合
[ 1 0 0 ][ 1 shx 0 ]
[ shy 1 0 ][ 0 1 0 ]
[ 0 0 1 ][ 0 0 1 ]
(译注:“剪切变换”又称“错切变换”,指的是类似于
四边形不稳定性那种性质,街边小商店那种铁拉门都见过吧?想象一下上面铁条构成的菱形拉动的过程,那就是“错切”的过程。)
旋转变换1,目标图形围绕原点逆时针旋转theta弧度,变换矩阵为:
[ cos(theta) -sin(theta) 0 ]
[ sin(theta) cos(theta) 0 ]
[ 0 0 1 ]
public static AffineTransform getRotateInstance(double theta, double x, double y)
旋转变换2,目标图形以(x, y)为轴心逆时针旋转theta弧度,变换矩阵为:
[ cos(theta) -sin(theta) x-x*cos+y*sin]
[ sin(theta) cos(theta) y-x*sin-y*cos ]
[ 0 0 1 ]
相当于两次平移变换与一次原点
旋转变换的复合:
[1 0 x][cos(theta) -sin(theta) 0][1 0- x]
[0 1 y][sin(theta) cos(theta) 0][0 1 -y]
[0 0 1 ][ 0 0 1 ][0 0 1]
这里是以空间任一点为圆心旋转的情况。
以上是关于仿射变换的相关知识,核心是平行性和平直性。
和仿射变换不同,另一类叫做透视畸变,显然,其不再具有仿射变换的平行性和平直性,例如广角镜头的那种广角畸变,边缘的直线变弯了,就是一种透视畸变,下面具体来讲一讲。
首先什么叫透视,
众所周知,我们的眼睛感觉远近的一种方法就是利用物体的相对大小,大脑会告诉我们物体远就显得小,距离越远,显得越小,远处的物体比相同大小的近处物体显得小。由于这一原因,平行的铁轨会随着我们向远处瞭望而显得越来越靠近,直至汇聚成一点。
透视还有另外一种表现,即物体越近,透视效果越强烈。比方说,200名士兵排成一纵队正在行进。如果在距离前面士兵10英尺的地方观看或拍摄队伍,那么前面的士兵就会显得比最后的士兵高大得多。但是,如果在远离前面士兵100米的地方观看或拍摄同一支队伍,第一个和最后一个士兵之间的大小差异就不会显得那么大。
透视的这两方面特征同样适用于所有的镜头,即:
1.被摄体越远,显得越小;
2.镜头离被摄体越远,被摄体外观上的大小变化越小。
比如用镜头拍狗,狗的鼻子拍的特别大,就是透视畸变的一种典型。