博客:blog.shinelee.me | 博客园 | CSDN
写在前面
2D图像常见的坐标变换如下图所示:
这篇文章不包含透视变换(projective/perspective transformation),而将重点放在仿射变换(affine transformation),将介绍仿射变换所包含的各种变换,以及变换矩阵该如何理解记忆。
仿射变换:平移、旋转、放缩、剪切、反射
仿射变换包括如下所有变换,以及这些变换任意次序次数的组合:
平移(translation)和旋转(rotation)顾名思义,两者的组合称之为欧式变换(Euclidean transformation)或刚体变换(rigid transformation);
放缩(scaling)可进一步分为uniform scaling和non-uniform scaling,前者每个坐标轴放缩系数相同(各向同性),后者不同;如果放缩系数为负,则会叠加上反射(reflection)——reflection可以看成是特殊的scaling;
刚体变换+uniform scaling 称之为,相似变换(similarity transformation),即平移+旋转+各向同性的放缩;
剪切变换(shear mapping)将所有点沿某一指定方向成比例地平移,语言描述不如上面图示直观。
各种变换间的关系如下面的venn图所示:
通过变换矩阵可以更清晰地看出这些变换间的关系和区别。
变换矩阵形式
没有平移或者平移量为0的所有仿射变换可以用如下变换矩阵描述:
[ x ′ y ′ ] = [ a b c d ] [ x y ] \left[ \begin{array}{l}{x'} \\ {y'}\end{array}\right]=\left[ \begin{array}{ll}{a} & {b} \\ {c} & {d}\end{array}\right] \left[ \begin{array}{l}{x} \\ {y}\end{array}\right] [x′y′]=[acbd][xy]
不同变换对应的 a , b , c , d a, b, c, d a,b,c,d约束不同,排除了平移变换的所有仿射变换为线性变换(linear transformation),其涵盖的变换如上面的venn图所示,其特点是原点位置不变,多次线性变换的结果仍是线性变换。
为了涵盖平移,引入齐次坐标,在原有2维坐标的基础上,增广1个维度,如下所示:
[ x ′ y ′ 1 ] = [ a b c d e f ] [ x y 1 ] \left[ \begin{array}{l}{x^{\prime}} \\ {y^{\prime}} \\ {1}\end{array}\right] =\left[ \begin{array}{lll}{a} & {b} & {c}\\ {d} & {e} & {f} \end{array}\right] \left[ \begin{array}{l}{x} \\ {y} \\ {1}\end{array}\right] ⎣⎡x′y′1⎦⎤=[adbecf]⎣⎡xy1⎦⎤
所以,仿射变换的变换矩阵统一用 [ a b