[计算机视觉] (一)图像形成

目录

1 几何基元

1.1 二维平面

2D点

2D直线

1.2 三维空间

3D点

3D平面

3D直线

2 变换

2.1 二维平面

平移

旋转

放缩

仿射

投影

2.2 三维空间

欧拉角 

轴/角(指数扭曲)


1 几何基元

1.1 二维平面

2D点

2D点即二维平面的像素坐标,其非齐次表达式可表示为一个列向量:\vec{x}=(x,y)或者

                                                                                      \vec{x}=\binom{x}{y}

齐次表达式:\vec{x}=(\widetilde{x},\widetilde{y},\widetilde{w}),在尺度上不同的矢量看成是相同的。

也可以将其变换成非齐次矢量形式:\vec{x}=\widetilde{w}(x,y,1)=\widetilde{w}\overline{x},其中,\overline{x}称为增广矢量。

我们可以把\widetilde{w}当作该点到原点距离的倒数,\widetilde{w}=0,可以视作该点距原点无穷远,这样就实现了齐次与非齐次表达式之间的转换。而后续计算往往需要用到的是增广矢量,所以我们只需要简单地把增广矢量当作是二维坐标点在原有横纵两个坐标的基础上添加一个常数为1的参数。

2D直线

齐次表达式:

在这里插入图片描述

对应的直线方程:

在这里插入图片描述

以及规范化直线方程

在这里插入图片描述

其中向量n为垂直于直线的法向量,d为直线与原点距离。

这里还有两个计算公式,

已知两直线求交点

在这里插入图片描述

 分别对应了已知两直线求交点和已知两点求直线的情形。

1.2 三维空间

3D点

非齐次表达式:

在这里插入图片描述

齐次表达式:

在这里插入图片描述

增广矢量:

在这里插入图片描述

基本上可以完全对照二维平面的表达式,只是在二维基础上多了一维参数。

3D平面

齐次表达式:

对应的平面方程:

以及规范化平面方程:

其中向量n为垂直于平面的法向量,d为其到原点的距离。

我们还可以将向量n表示为两个角度的函数:

3D直线

直线的表达就没有上面的式子那么优美了,一种表达方式是通过两个点(p,q)表示:r = (1-λ)p + λq. (当我们限定0<=λ<=1时,得到的便是p,q间的一条线段

当然我也可以直接写成r = μp + λq的形式。

2 变换

2.1 二维平面

平移

变换前后的矢量间关系:

在这里插入图片描述

x和y分别是横纵坐标平移的单位距离。

旋转

变换前后的矢量间关系:

在这里插入图片描述

θ为逆时针旋转角度。

放缩

变换前后的矢量间关系:

在这里插入图片描述

x和y分别是横纵坐标放缩的比例。

仿射

参考:https://www.cnblogs.com/shine-lee/p/10950963.html

投影

也可以称为透视变换或者同态变换,是作用在齐次坐标下的:

在这里插入图片描述

其中H是任意一个三阶方阵。

放射变换和透视变换的区别:https://blog.csdn.net/flyyufenfei/article/details/80208361

2.2 三维空间

欧拉角 

该旋转系有三个参数,分别是方向向量与三个坐标轴所成方向角。这种参数选择在参数空间中并不能光滑地移动,所以很少使用。

轴/角(指数扭曲)

该旋转系有四个参数,分别是旋转轴的三个方向向量(单位向量)和旋转角度,可以得到如下变换矩阵公式:

在这里插入图片描述

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
回答: 在3D计算机视觉中,图像分类是指将图像中的像素点分割成不同的区块,并为每个区块分配类别标签的过程。这个过程可以通过图像分割技术来实现。图像分割是图像处理的重要组成部分,也是一个难点。通过给出图像中每个像素点的标签,可以将图像分割成若干带类别标签的区块。图像分割技术已经在交通控制、医疗影像和人脸识别等多个领域得到了广泛的应用。\[1\]在3D计算机视觉中,图像分类还涉及到将3D图元投影到图像平面上的过程。可以使用线性3D到2D投影矩阵来实现这一过程。最简单的模型是正交法,它不需要除法就可以得到最终的结果。更常用的模型是透视,因为它更准确地模拟了真实相机的行为。\[2\]此外,还需要考虑像素传感器间距和传感器平面与原点的相对位置来转换结果坐标。这些几何图形的转换过程可以通过使用传感器单应性和相机内在矩阵来实现。传感器单应性用于将2D像素坐标映射到3D射线,而相机内在矩阵用于将3D相机中心点映射到2D像素坐标。\[3\]综上所述,3D计算机视觉图像分类涉及到图像分割、投影和坐标转换等过程。 #### 引用[.reference_title] - *1* [计算机视觉论文总结系列(二):图像分割篇](https://blog.csdn.net/qq_36816848/article/details/129629857)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [计算机视觉 图像形成 几何图形和变换 3D到2D投影](https://blog.csdn.net/bashendixie5/article/details/124991406)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值