为什么要引入齐次坐标

前面我们提到了图像的缩放变换和旋转变换,可以用矩阵乘法的形式来表达变换后的像素位置映射关系。

那么,对于平移变换呢?平移变换表示的是位置变化的概念。如下图所示,一个图像矩形从中心点[x1,y1]平移到了中心点[x2,y2]处,整体大小和角度都没有变化。在x方向和y方向上分别平移了tx和ty大小。
这里写图片描述
显然:

x2=x1+tx x 2 = x 1 + t x
y2=x2+ty y 2 = x 2 + t y

这对于图像中的每一个点都是成立的。写成矩阵的形式就是:
[x2y2]=[x1y1]+[txty](78) (78) [ x 2 y 2 ] = [ x 1 y 1 ] + [ t x t y ]

我们再把前面的缩放变换和旋转变换的矩阵形式写出来:
缩放变换:

[x2y2]=[kx00ky][x1y1](79) (79) [ x 2 y 2 ] = [ k x 0 0 k y ] [ x 1 y 1 ]

旋转变换:

[x2y2]=[cosθsinθsinθcosθ][x1y1](370) (370) [ x 2 y 2 ] = [ c o s θ − s i n θ s i n θ c o s θ ] [ x 1 y 1 ]

我们注意到,缩放变换和旋转变换都可以表示成矩阵乘法的形式。实际上,图像的几何变换通常不是单一的,也就是说经常性的缩放、旋转、平移一起变换。例如先放大2倍,然后旋转45度,然后再缩小0.5倍。那么就可以表示成矩阵乘法串接的形式:
[x2y2]=[0.5000.5][cos45sin45sin45cos45][2002][x1y1](371) (371) [ x 2 y 2 ] = [ 0.5 0 0 0.5 ] [ c o s 45 − s i n 45 s i n 45 c o s 45 ] [ 2 0 0 2 ] [ x 1 y 1 ]

这样,不管有多少次变换,都可以用矩阵乘法来实现。但是平移变换呢?从前面看到,平移变换并不是矩阵乘法的形式,而是矩阵加法的形式!

那能不能把缩放变换、旋转变换、平移变换统一成矩阵乘法的形式呢,这样不管进行多少次变换,都可以表示成矩阵连乘的形式,将极大的方便计算和降低运算量。

这种方法就是“升维”,引入“齐次坐标”,将图像从平面2D坐标变成3D坐标。我们看看平移变换的矩阵形式:

[x2y2]=[x1y1]+[txty](372) (372) [ x 2 y 2 ] = [ x 1 y 1 ] + [ t x t y ]

将其升维,变成3维,上式就可以表示成:
x2y21=100010txty1x1y11(373) (373) [ x 2 y 2 1 ] = [ 1 0 t x 0 1 t y 0 0 1 ] [ x 1 y 1 1 ]

这是个非常优美的地方,学习过矩阵乘法的同学可以算一下右边的式子,是否最终结果与前面是一样的。

这样,平移变换通过升维后的齐次坐标,也变成了矩阵乘法的形式。当然缩放变换和旋转变换的矩阵形式也得改一改,统一变成3维的形式。
缩放变换:

x2y21=kx000ky0001x1y11(374) (374) [ x 2 y 2 1 ] = [ k x 0 0 0 k y 0 0 0 1 ] [ x 1 y 1 1 ]

旋转变换:
x2y21=cosθsinθ0sinθcosθ0001x1y11(375) (375) [ x 2 y 2 1 ] = [ c o s θ − s i n θ 0 s i n θ c o s θ 0 0 0 1 ] [ x 1 y 1 1 ]

终于统一了。以后所有的变换,不管怎样变换,变换多少次,都可以表示成一连串的矩阵相乘了,这是多么的方便。这就是引入齐次坐标的作用,把各种变换都统一了起来。

  • 39
    点赞
  • 61
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
### 回答1: 齐次坐标(Homogeneous coordinates)是计算机视觉和图形学中常用的一种坐标系统。它可以将几何图形中的点、向量、平面等抽象概念用一个更为简单和统一的方式表示出来,从而方便计算机对它们进行处理。 在齐次坐标中,一个点的坐标由四个分量表示,通常表示为(x, y, z, w),其中(x, y, z)是点在三维空间中的坐标,w是一个称为齐次坐标参数(homogeneous coordinate parameter)的参数。齐次坐标参数可以取任意非零值,但是通常取1,这样可以避免数值计算中的除法操作。 使用齐次坐标,可以将二维图形中的变换表示为一个3x3的矩阵变换,而将三维图形中的变换表示为一个4x4的矩阵变换,这样可以方便地进行矩阵乘法等数值计算。齐次坐标还可以用于表示平面、直线和多边形等几何图形,方便进行投影和变换操作。 ### 回答2: 齐次坐标是指在计算机视觉中广泛应用的一种扩展形式的坐标表示方法。在齐次坐标中,一个点的坐标由其原始的几何坐标(x、y)和一个额外的维度(w)组成,即(x, y, w)。 齐次坐标可以理解为在欧几里得空间中的同一个坐标系中,通过引入一个额外的维度w来扩展原始坐标。这个额外的维度w允许我们同时表示平移和旋转操作,从而更方便地进行计算。 在齐次坐标中,一个点的坐标可以通过除以w来恢复原始的几何坐标,即:x = x' / w,y = y' / w。这意味着通过齐次坐标可以方便地进行坐标变换,例如平移、旋转、缩放等,并且不需要进行额外的计算。 齐次坐标在计算机视觉中的广泛应用主要体现在图像变换和计算几何变换中。例如,在图像变换中,我们可以通过齐次坐标方便地进行图像的平移、旋转等操作。在计算几何变换中,我们可以通过齐次坐标进行方便地进行三维点的投影等操作。 总之,齐次坐标通过引入一个额外的维度w,扩展了原始点的坐标表示,方便了计算机视觉中的图像变换和几何变换的操作。 ### 回答3: 齐次坐标是计算机视觉领域中常用的一种表示方法,它是通过在传统的欧几里得坐标系上引入一个额外的维度来扩展的。具体来说,在齐次坐标中,一个点或向量由四个分量表示,通常记作(x, y, z, w),其中(x, y, z)表示点的三维坐标,w表示缩放因子。 齐次坐标的一个重要应用是可以将欧几里得空间中的平移运算与仿射变换(包括平移、旋转、缩放和错切)统一起来。通过齐次坐标,我们可以将平移操作以矩阵的形式表示,并与其他变换操作(如旋转、缩放)组合在一起。 齐次坐标还可以简化对图像的透视变换处理。在传统的欧几里得空间中,透视变换会引入非线性变换,计算复杂度较高。而在齐次坐标中,透视变换可以通过线性变换来表示,简化了计算过程。 在OpenCV库中,齐次坐标经常用于表示图像中的关键点(如角点、边缘点)和几何变换过程中。OpenCV提供了丰富的函数和工具,用于处理和计算齐次坐标表示的点和向量,包括坐标转换、透视变换、仿射变换等。 总之,齐次坐标是计算机视觉中一种重要的数学工具,它通过引入额外的维度,将欧几里得空间中的几何变换问题转化为线性变换问题,简化了计算过程,提高了计算效率。
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值