OpenGL学习脚印: 坐标和变换的数学基础(math-coordinates and transformations)

最新推荐文章于 2024-07-18 17:28:20 发布

fu_shuwu

最新推荐文章于 2024-07-18 17:28:20 发布

阅读量1.6k

点赞数

Android 同时被 2 个专栏收录

202 篇文章

订阅专栏

Opengl

25 篇文章

订阅专栏

http://blog.csdn.net/wangdingqiaoit/article/details/51394238
写在前面 ,

上一节介绍了向量和矩阵，本节将熟悉坐标、线性变换、仿射变换以及坐标转换等概念和计算方法，这些内容对后续的学习将会有很大帮助。部分内容不是OpenGL编程初学者所必须掌握的，可以在以后需要时再回头来看。这里是对这些知识点的一个总结，旨在对他们有个整体把握，后面具体应用时会使用这些概念。内容尽量以例子形式说明，仅在必要时会给出数学证明。一个主题往往涉及过多内容，对于文中省略的部分，请参考相应的教材。

通过本节可以了解到

坐标的概念
线性变换的概念和计算方法
仿射变换
坐标转换的概念和计算方法

坐标系及坐标

坐标是在特定坐标系下表示物体位置的方法，一谈到坐标，必定是在某个坐标系下给定的。例如经纬度坐标是相对于地球的球面坐标系统给出的。

坐标系则给出了一个参考框架，在这个框架里面，定义其他位置相对于一个起始点（这个起始点称作原点O）的位置。同一位置，在不同的坐标系下会有不同的坐标，例如你所在城市以经纬度坐标表示，是相对于地球坐标系来给定的，如果从太阳系或者银河系来给定，又会是另外一个不同的值。
常见的坐标系包括:笛卡尔坐标系，极坐标系，球面坐标系等。
如下图所示的我们熟悉的，2D笛卡尔坐标系(来自wiki):

如下图所示的熟悉的3D笛卡尔坐标系(来自wiki):

定义坐标系

定义一个坐标系需要指定(参考自Objectsin Motion):

坐标系的维度 2D, 3D, 4D等等
定义坐标空间轴的向量这些向量成为基向量，他们有名字，例如x,y,z;这些向量一般而言都是正交的，但不一定非得互相正交(只要线性无关即可，后面介绍)，但是每一个维度必须只有一个轴。
坐标系的原点O 原点是导出其他点的参考点。
一个表明空间中点是否合法的区域在此区域之外的点就不再合法。这个区域根据空间不同，可以是无穷的。

这里，维度已由基向量维数确定，合法区域一般是无穷的，但是在图形处理中某些坐标空间是有限的，例如规范化设备空间（后面其他文章会介绍）。作为一个了解，基向量不一定非得正交，如下图所示:

对于一般情况，我们只需要记住:
坐标系=(基向量，原点O)

左手坐标系和右手坐标系

对于任意2个2D坐标系，我们通过旋转、移动翻转可以将两个坐标系xy轴的指向相同。

但是对于3D坐标系，任意两个坐标系却不能等价。实际上，存在两种完全不同的3D坐标系：左手坐标系和右手坐标系。如果同属于左手坐标系或者右手坐标系，则可以通过旋转来重合，否则不可以。
判断一个坐标系是否属于右手系，可以拿出右手，然后右手的大拇指代表+x轴指向，食指代表+y轴指向，中指代表+z轴指向，你可以转动你的右手来匹配这个坐标系，如果能匹配则是右手坐标系，否则是左手坐标系。判断左手坐标系的方法类似。如下图所示为判断右手坐标系的方法(来自OpenGLcoordinate system):

关于左右手坐标系理解还可以可参考下图(来自《3D数学基础》):

如上右图右手坐标系，这里拇指、食指、其余手指分别代表x,y,z轴的正方向。高等数学教材上使用的是右手坐标系。

旋转正方向的判断

同样还存在一个左手规则和右手规则，可以用于判断当物体绕轴旋转时正方向的判定问题。

对于左手规则，确定一个旋转轴后，左手握成拳头，拇指指向旋转轴的正方向，则其余手指弯曲方向即为旋转的正方向。从旋转轴正向末端来看，正向旋转是顺时针的。对于右手规则，有同样的方法。可参见下图：

左手右手规则在不同场合有着不同作用。上一节，我们使用右手规则判断了叉积的结果向量的方向。

注意OpenGL中坐标系 OpenGL中的物体、世界、照相机坐标系都属于右手坐标系，而规范化设备坐标系使用左手坐标系。笼统地说OpenGL使用右手坐标系是不合适的。这些坐标系后面会介绍。关于这个问题可以参考SO.

坐标

坐标是在指定坐标系中，相对于原点O给出的一个位置。这个位置可以用有序实数对表示(有些坐标系中可能使用复数)，注意数对中的数字顺序对结果有影响。上面提到坐标系=(基向量，原点O)，3D坐标系用向量表示为:
⎧⎩⎨⎪⎪i=(ax,by,bz)j=(bx,by,bz)k=(cx,cy,cz)(基向量)
O=(Ox,Oy,Oz)(坐标原点)
这样在坐标系中一点P与原点O构成的向量:
r=OP→=xi+yj+zk
这时称(x,y,z)为点P的坐标，这个坐标也可以表示向量OP→.
一般地使用的3D笛卡尔坐标系使用标准基向量和坐标原点：
⎧⎩⎨i=(1,0,0)j=(0,1,0)k=(0,0,1)(标准基向量)
O=(0,0,0)(标准坐标原点).

从上面可以看到，在一个坐标系中，求取坐标的过程，是一个向量分解的过程。求取一个位置在另一个不同的坐标系中的坐标，则需要进行坐标转换。后面会介绍。

使用坐标系的优势

使用坐标系统便能以解析几何的形式来研究空间几何。通过建立一个坐标系使得空间中点用有序实数组表示，空间图形用方程表示，这样能方便地研究几何图形的性质。

必要基础概念

了解线性变换、仿射变换以及坐标转换，对于后面学习图形编程中的模型变换方法有很大帮助，因此这里予以介绍。要了解这些概念，需要一些其他概念的支撑，这里逐一介绍。每一个概念以定义结合示例的形式给出，如果暂时没有理解清楚，可以暂时跳过，以后回过头来再看或者参考这个主题的其他资料。本部分最后会给出完整的线性变换示例。

向量组的线性组合

向量组是一组向量的集合，例如α1,α2,⋯,α

m表示一个由m个n×1的矩阵(n维列向量)组成的列向量组。对应的也有行向量组的概念。如果存在一组实数λ1,λ2,⋯,λm，使得向量β满足下式:
β=λ1α1+λ2α2+⋯+λmαm(1)

则称向量β是α1,α2,⋯,αm的线性组合，或者说β由α1,α2,⋯,αm线性表示。上述求解点P坐标时向量r分解为向量组i,j,k表示的过程，就是一个找出线性表示系数的过程。

向量组线性无关

对于向量组α1,α2,⋯,αm，如果存在不全为零的数λ1,λ2,⋯,λm，使下面的等式成立:
λ1α1+λ2α2+⋯+λmαm=0(2)
则称向量组α1,α2,⋯,αm线性相关(linearlydependent), 否则称为线性无关( linearly independent)。也就是要使向量组α1,α2,⋯,αm线性无关，那么所有的系数λi都必须为0。

线性相关的一种几何解释来自math.stackexchange:
假定你有一组向量{x1,x2,⋯,x5}，你从某个点出发，沿着x1走动一段距离，然后沿着x2走动一段距离, 最后沿着x5走动一段距离，最终你又回到了出发点（这里表明存在λ1x1+λ2x2+λ5x5=0,即式2成立）。这就说明{x1,x2,⋯,x5}是线性相关的。

当然存在其他方法，判断向量组线性相关性，感兴趣的可以参考线性代数教材。

线性空间的基

向量空间(也叫做线性空间)是对我们经常使用的2D和3D空间一般规律的拓展，它的定义主要反映的是满足一系列的运算规律，例如交换律和结合律等。由于这个定义包含较多规则，不在此列出，感兴趣的可以参考vector space。

如果在线性空间V中存在n个线性无关的向量α1,α2,⋯,αn使得V中任意元素α都能由他们线性表示，则称α1,α2,⋯,αn为V的一个基。基所含向量个数n称为线性空间V的维数，并称V为n维线性空间。

例如2D空间中，二维向量组 i=(1,0),j=(0,1)是它的一个基；在3D空间中，向量组: i=(1,0,0),j=(0,1,0),k=(0,0,1)是它的一个基。类似的可以推广到n维向量空间的基。

向量在基下的坐标

设α1,α2,⋯,αn是n维线性空间V的一个基，若任取α∈V，总有且仅有一组有序实数x1,x2,⋯,xn，使得:
α=x1α1+x2α2+⋯+xnαn=(α1,α2,⋯,αn)
成立，则称这组有序数x1,x2,⋯,xn为元素α在基α1,α2,⋯,αn下的坐标，记作(x1,x2,⋯,xn)T。

这里元素α用基向量组的线性组合来表示，坐标就是线性组合的系数。例如向量a=(3,4)=3e1+4e2，其中e1=(1,0),e2=(0,1)为标准基，则a的坐标为(3,4)T。

线性变换(LinearTransformations)

变换这个词类似于函数，即将一个定义域里的输入量转化为值域里的另一个值，变换就是一个映射关系，一种规则。线性变换的一些性质对于后续学习3D模型变换时，理解起来将会更容易。

线性变换 T:U→V是一个函数，将定义域U中元素，映射到值域V中，并满足下列两个条件(参考Definition LT):
1)可加性对任意u1,u2∈U，都满足: T(u1+u2)=T(u1)+T(u2)
2)齐次性对任意u∈U和任意标量k，都满足: T(ku)=kT(u)

可以利用上面的两个条件，即可加性和齐次性条件验证一个变换是否是线性变换。
线性变换示例(来自Example ALT)
T(⎡⎣⎢x1x2x3⎤⎦⎥)=[2x1+x3−4x2]
首先验证其是否满足可加性:

然后验证是否满足齐次性: 由上述*和**式可知，变换T满足可加性和齐次性，因而是线性变换。
实际上判断线性变换还有一个简单方法，即看变换后每个组成部分是不是原来分量的倍数（不能为常量）。
例如变换f(x,y,z)=(3x−y,3z,0,z−2x)是线性变换，而:
g(x,y,z)=(3x−y,3z+2,0,z−2x)和
h(x,y,z)=(3x−y,3xz,0,z−2x)
都不是线性变换。其中g中3z+2的部分2是个常量，不满足倍数要求；h中3xz不满足倍数要求，因而也不是线性变换。
对于线性变换一个重要的性质是(令齐次性表达式中u=0可得到):
T(0)=0(1)

线性变换与矩阵一一对应

对一个线性变换T，存在一个矩阵A与之对应，变换表示为T(x)=Ax，其中x为列向量。

证明: 1.首先证明充分性。
当T是线性变换时，对于x∈U，其中

，有:

其中:
A=(T(e1),T(e2),⋯,T(en))称为标准矩阵，它的每一列都是标准基ei变换后的向量在原基下的表示。
2.证明必要性
当变换T对应矩阵A，表示为T(x)=Ax时，证明T为线性变换。
由矩阵乘法性质，容易得到:
T(x+y)=A(x+y)=Ax+Ay=T(x)+T(y)(矩阵乘法分配律)
T(kx)=A(kx)=kA(x)=kT(x)(矩阵标量乘法法则)
则说明T满足可加性和齐次性，因而是一个线性变换。
由1,2得到，线性变换T总是与一个矩阵A一一对应。

例如矩阵A如下(下面的例子来自:Matrices and lineartransformations):
A=[1301−12].
对应的线性变换为:
T(x)=Ax=[1301−12]⎡⎣⎢xyz⎤⎦⎥=[x−z3x+y+2z]=(x−z,3x+y+2z).
由给定的线性变换:
f(x,y)=(2x+y,y,x−3y)
要找到对应的矩阵A，由上面定理证明时可知，标准矩阵A的内容为:
A=(f(e1),f(e2)))
其中f(e1)计算如下:
f(e1)=f(1,0)=(2,0,1)=⎡⎣⎢201⎤⎦⎥.
f(e2)计算如下:
f(e2)=f(0,1)=(1,1,−3)=⎡⎣⎢11−3⎤⎦⎥.
所以最终计算得到矩阵A如下:
A=⎡⎣⎢20111−3⎤⎦⎥.

后面会详细介绍矩阵A的计算方法。在此之前，先来看下线性变换的应用。

线性变换的应用

线性变换在3D图形中模型变换部分应用很多，例如旋转、错切(shear)、缩放等操作都是线性变换。在OpenGL中使用矩阵操作来表示这些线性变换。例如2D平面上绕原点的旋转θ角度的操作如下图所示:

通过利用极坐标系表示x,y和x′,y′并利用三角函数公式（具体过程略,有兴趣可以自行推导，后面会介绍另外一个更简洁的方法），得到旋转矩阵为:
[x′y′]=[cosθsinθ−sinθcosθ][xy]
那么矩阵:
A(θ)=[cosθsinθ−sinθcosθ]表示的就是这个围绕原点旋转θ角度的线性变换。

使用矩阵表达变换的优势通过使用矩阵形式，能够级联对物体顶点的变换，例如先执行旋转，后执行缩放，则表示为:T(x)=TsTrx=(TsTR)x，可以在对描述物体组成的多个顶点执行变换之前，先计算出矩阵(TsTR)，从而节省执行变换需要的时间；同时也能表示为逆操作，例如旋转−θ角度，T(x)=A(−θ)x。只是在OpenGL中使用的标准矩阵A是4x4的，后面会介绍原因和具体构造方法。

线性变换对应矩阵的计算方法(重要结论)

线性变换由基及变换后基的值唯一确定，通过计算线性变换后基的值可以得到线性变换对应的矩阵A。这是本节讲述线性变换最重要的结论。

定理: 设u1,u2,⋯,un是线性空间U的一个基，线性空间V包含向量v1,v2,⋯,vn(可以相同)。那么存在唯一的线性变换T:U→V使得:T(ui)=vi(1≤i≤n)。

上面的定理证明，感兴趣的可以参考 Theorem LTDB，不在此处给出详细过程。

这个定理告诉我们: 只要知道了线性空间U的给定基u1,u2,⋯,un在线性变换T下对应的值T(u1),T(u2),⋯,T(un)，线性变换T也就由ui及T(ui)的对应关系确定了。
这个定理的作用就好比，两点确定一条直线。因此我们可以通过计算:
A=(T(u1),T(u2),⋯,T(un))来获取线性变换T对应的矩阵A。

也就是说，矩阵A的列向量，由T(ui)在基u1,u2,⋯,un下的坐标唯一确定。同时给出一个矩阵A作为线性变换T在基u1,u2,⋯,un下的矩阵，也就给出了该基在线性变换T下对应的值T(u1),T(u2),⋯,T(un)，从而确定了线性变换T。这表明线性变换T与矩阵之间存在一一对应关系，上面已经证明了这个结论。

例如对于上面的旋转矩阵，从基和转换后基的角度，也就是从x,y轴来看，x转换后为x′，y转换后为y′，如下图所示(doitpoms.ac.uk):。

利用三角函数公式可以计算转换后x′,y′对应的坐标，如下图所示(来自:Rotationsand Infinitesimal Generators):
。
因此可以顺利的写出旋转矩阵为:
R(θ)=[cosθsinθ−sinθcosθ]。
矩阵第一列即为x转换后的x′轴的对应的坐标，第二列即为y转换后的y′轴对应的坐标。显然这个计算方法，比利用极坐标公式来得快。
在后面使用OpenGL模型变换矩阵时，经常要使用到这个方法，理解了这一点后面理解模型变换矩阵就会变得简单。

基变换与坐标变换(重要结论)

一个位置，在不同的坐标系里有不同的坐标。设u={u1,u2,⋯,un}和v={v1,v2,⋯,vn}是n维线性空间V的两个基。两个基之间可以互相表示。因此存在9个标量λij，使得:
u1=λ11v1+λ12v2+λ13v3
u2=λ21v1+λ22v2+λ23v3
u3=λ31v1+λ32v2+λ33v3
λij写成矩阵形式得到:

则上面的式子可以简写为:
u=Mv(a)
矩阵M称为过渡矩阵，通过矩阵M我们可以把向量在基u下的表示转换为基v下的表示，通过M−1可以把向量在v下的表示转换为u下的表示。
设有一个向量w，它在基u和v下的表示分别为:

w=a1v1+a2v2+⋯+anvn=aTv=b1u1+b2u2+⋯+bnun=bTu

其中:

由上式得到:
aTv=bTu(b)

将式子a代入式子b得到:
a=MTb(c)
b=(MT)−1a=Ta(d)

式子c和d给出了向量w的两个坐标之间的转换公式。
上面的矩阵MT：

这个矩阵的三个列向量，就是基u={u1,u2,⋯,un}的向量在基v下的坐标表示，即:
MT=([u1]v,[u2]v,⋯,[un]v)
对应的(MT)−1矩阵即是v={v1,v2,⋯,vn}在u下的坐标表示。
(MT)−1=([v1]u,[v2]u,⋯,[vn]u).
那么上面的式子c和d可以分别改写为:
[ω]v=[u]v[ω]u(e)
[ω]u=[v]u[ω]v(f)

从式子e和f来看，我们可以得出，要在两个基之间转换坐标，只需要求出一个基在另一个基里的坐标表示即可，这个坐标表示构成矩阵MT或者(MT)−1。

示例
已知基u为:
u1=(1,2,1,0),u2=(3,3,3,0),u3=(2,−10,0,0),u4=(−2,1,−6,2)
基v为:
v1=(1,2,1,0),v2=(1,−1,1,0),v3=(1,0,−1,0),v4=(0,0,0,2)
容易求出:
v1=u1
v2=−2u1+u2
v3=11u1−4u2+u3
v4=−27u1+11u2−2u3+u4
即:

也可得:
u1=v1
u2=2v1+v2
u3=−3v1+4v2+v3
u4=−v1−3v2+2v3+v4
即:

给定向量ω=(6,−1,2,2)，容易验证:
ω=v1+3v2+2v3+v4
也就是:
[w]v=⎡⎣⎢⎢⎢1321⎤⎦⎥⎥⎥
那么:

容易验证:
(1) w=−10u1+6u2+u4
(2) [u]−1v=[v]u

仿射变换

线性变换无法表达一类重要的变换——平移变换。平移变换表达的是对于点p=(x,y,z)经过d=(αx,αy,αz)所表示的位移后得到点p′=(x′,y′,z′)的过程，表示为：
p′=p+d
我们尝试寻找变换T满足:T(x)=Ax=p′=⎡⎣⎢x+αxy+αyz+αz⎤⎦⎥
当d≠0时，上式中T(0)≠0，由式子1可知，这不是线性变换。因此需要引入仿射变换的概念。

仿射变换与线性变换不同之处在于，线性变换保持原点位置不变，而仿射变换可以改变原点的位置。仿射变换包括线性变换，例如旋转，缩放等变换，特殊地是仿射变换包括平移变换。例如f(x)=2x是一个线性变换，也是仿射变换；而f(x)=2x+3是仿射变换。感兴趣的可以参考What isthe difference between linear and affine function。一般而言，仿射变换是线性变换+平移变换。

使用3x3矩阵无法表达平移变换(当d≠0时方程T(x)=A3×3x=p′无解，感兴趣可以参考Reasonfor homogeneous)，但是以一个统一的方式表达变换，在计算中将便于计算，因此需要引入齐次坐标系的概念来完成这个目标。从编程角度来讲，在OpenGL中引入齐次坐标系主要是为了表达平移变换和投影变换中的透视除法。如果你要从数学角度理解齐次坐标系，这对数学要求较高，将会涉及到射影几何等概念，感兴趣的话可以参考The TruthBehind Homogeneous Coordinates。

齐次坐标(homogeneouscoordinate)

齐次坐标是在原来坐标的基础上添加了一个w成分。在3D中使用(x,y,z)既能表示点，又能表示向量，容易引起混淆。使用齐次坐标能够克服这个困难。具体做法是，在由原点P0和基v1,v2,v3所定义的坐标系中，任意点P可以表示为:
P=α1v1+α2v2+α3v3+P0。
定义标量0和1与点的乘法为:
0.P=0,1.P=P，则可以把点P表示为: 可以把向量w=β1v1+β2v2+β3v3表示为: 因此，使用齐次坐标系表示点形式为: 表示向量为: 这里齐次坐标的w成分为0或者1，在后面投影变换的透视除法时还会看到w成分的其他值。

使用4x4矩阵表示仿射变换

对于上面的平移变换: 当A为4x4矩阵时，使用齐次坐标，x表示为p=(x,y,z,1), d=(αx,αy,αz,0), p′=(x′,y′,z′,1)。
可以计算得到A为:

上面的矩阵A对应平移变换，对于线性变换，矩阵A中：
d=(αx,αy,αz,0)=(0,0,0)。
也就是说矩阵A的结构为:

使用4x4矩阵表示坐标转换

前面介绍的基变换与坐标变换，没有考虑到原点，两个坐标系的原点位置可能不同，因此需要使用4x4矩阵调整下上面的结果。对于参考点P0和基u={u1,u2,⋯,un}，以及参考点Q0和基v={v1,v2,⋯,vn},除了上面的等式:
u1=λ11v1+λ12v2+λ13v3
u2=λ21v1+λ22v2+λ23v3
u3=λ31v1+λ32v2+λ33v3
还需要添加一个Q0与P0关系式:
Q0=P0+λ41v1+λ42v2+λ43v3
写成矩阵形式为:

其中M是一个4x4矩阵:

。坐标转换的其余部分，与上面讲述的3x3矩阵类似。

坐标转换示例1

下图所示的旋转坐标系后，求取原坐标系下点p在[s,t]坐标系下坐标，如下图所示：

直接利用极坐标推导的过程，请参考坐标旋转变换公式的推导。我们使用上面介绍的寻找基向量之间关系的方法来计算这个变换矩阵。
已知xoy坐标系下基e=(e1,e2)用sot坐标系的基表示矩阵为:

[e]sot=[cosθ−sinθsinθcosθ]

那么:
[w]sot=[e]sot[w]xoy
即:

[st]=[cosθ−sinθsinθcosθ][xy]

坐标转换示例2

这个例子来自参考资料[1]。
如下图所示，存在两个坐标系，世界坐标系和照相机坐标系：

其中照相机坐标系的原点位于世界坐标系的P(1,0,1,1)处，并且照相机指向世界坐标系的原点，则照相机指向向量n=(−1,0,−1,0)T，照相机的观察正向同世界坐标系地y轴一样，为v=(0,1,0,0)T,利用叉积n×v计算出相机的第三个正交的方向u=(1,0,−1,0)T。
那么点O和xyz轴构成的世界坐标系和以点P及uvn构成的照相机坐标系之间存在转换关系。其中uvnP在世界坐标系的表示为:

xyzO在照相机坐标系下的表示为:

则世界坐标系的原点O在uvnP坐标系下的坐标为:

这个即求出世界坐标系的原点在照相机坐标系下的(0,0,1,1)处。

同时照相机坐标系下的原点P在世界坐标系xyzO下的表示为:

这个即求出了照相机坐标系的原点在世界坐标系的P(1,0,1,1)处。
这个例子说明了不同坐标系下坐标之间的转换，后面还会详细介绍OpenGL中使用的坐标转换。

参考资料

[1]《交互式计算机图形学-基于OpenGL着色器的自动向下方法》电子工业出版社 Edward Angle等著
[2]《3D数学基础：图形与游戏开发》清华大学出版社
[3]《线性代数》武汉大学数学与统计学院高等教育出版社齐民友主编
[4] Linear Transformations
[5] matrices_linear_transformations
[6] Lineartransformations
[7] Objectsin Motion
[8] 很棒的 LINEAR TRANSFORMATIONS 课件