【深度学习基础知识 - 26】相机的内参、外参以及像素坐标和世界坐标的转换

计算机视觉中的深度估计、SLAM、三维重建任务通常会用到相机参数作为输入,本文将对其进行简单介绍。

相机的内参

  • 相机的内参矩阵包含x方向的焦距fx和y方向的焦距fy。以及相机光轴在x方向和y方向上的偏移量cx,cy。
    在这里插入图片描述
  • 内参为什么有两个焦距
    • 一般来说,一个物体的宽度和高度会随着各个物体与相机之间的距离增加按照比例变小。而对于一张矩形的图片,物体的高宽变小的比例是不同的,这个比例就是根据焦距得到的,因此会有x方向和y方向各自的焦距。如下图公式:
      在这里插入图片描述

相机的外参

  • 相机的外参也被称为旋转平移矩阵,包括xyz三个轴的旋转参数,即旋转矩阵(R矩阵)。还有三个轴的平移参数,也就是平移矩阵(T矩阵)。

像素坐标和世界坐标的转换

  • 相机的外参通常用于像素空间到世界坐标的转换。公式如下图,其中(u, v)是像素坐标,(x, y, z)是世界坐标。
    在这里插入图片描述
    简化后得到:
    在这里插入图片描述

博主会持续更新一些深度学习相关的基础知识以及工作中遇到的问题和感悟,喜欢请关注、点赞、收藏。

  • 9
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
像素坐标系中的点转换到机械坐标系中,需要知道相机内参矩阵和外参矩阵。内参矩阵包括相机的焦距、主点坐标以及像素大小等信息,用来描述像素坐标系和归一化平面坐标系之间的关系;外参矩阵包括相机世界坐标系中的旋转和平移变换参数,用来描述相机坐标系和世界坐标系之间的关系。根据这些参数,可以按照以下步骤将像素坐标系中的点转换到机械坐标系中: 1. 将像素坐标系中的点 $(u, v)$ 转换为归一化平面坐标系中的点 $(x, y)$,其中 $x = (u - u_0) / f_x$,$y = (v - v_0) / f_y$,$u_0$ 和 $v_0$ 分别表示主点坐标,$f_x$ 和 $f_y$ 分别表示相机的水平和竖直方向上的焦距。 2. 将归一化平面坐标系中的点 $(x, y)$ 转换相机坐标系中的点 $(X_c, Y_c, Z_c)$,其中 $X_c = x Z_c$,$Y_c = y Z_c$,$Z_c$ 表示相机坐标系中的深度值。这个过程可以使用内参矩阵和投影矩阵进行实现。 3. 将相机坐标系中的点 $(X_c, Y_c, Z_c)$ 转换世界坐标系中的点 $(X_w, Y_w, Z_w)$,其中 $X_w = R_{11} X_c + R_{12} Y_c + R_{13} Z_c + T_x$,$Y_w = R_{21} X_c + R_{22} Y_c + R_{23} Z_c + T_y$,$Z_w = R_{31} X_c + R_{32} Y_c + R_{33} Z_c + T_z$,$R$ 表示相机坐标系到世界坐标系之间的旋转矩阵,$T$ 表示相机坐标系到世界坐标系之间的平移向量。这个过程可以使用外参矩阵进行实现。 4. 将世界坐标系中的点 $(X_w, Y_w, Z_w)$ 转换为机械坐标系中的点 $(X_m, Y_m, Z_m)$,其中 $X_m = X_w + T_{mx}$,$Y_m = Y_w + T_{my}$,$Z_m = Z_w + T_{mz}$,$T_m$ 表示世界坐标系到机械坐标系之间的平移向量。这个过程需要知道机械坐标系和世界坐标系之间的相对位置关系。 通过以上步骤,可以将像素坐标系中的点转换到机械坐标系中,实现精确的定位和控制。需要注意的是,在实际应用中,还需要考虑相机的畸变和误差等因素,以提高计算的精度和稳定性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

雁宇up

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值