世界坐标系/相机坐标系/图像坐标系 转换

一、各坐标系简要介绍

在这里插入图片描述

首先介绍数字图像处理领域中的图像坐标系,如上图左图所示,坐标系O_0为图像坐标系,其原点是在图像的左上角,每一个像素通过其所在位置的列数和行数索引 (u,v) 来表示。

另外需要建立图像坐标与物理单位的关系,而后才能将目标的真实世界坐标转换为图像坐标。即建立以物理单位表示的物理图像坐标系有些文章将这个坐标系称为图像坐标系,而将数字图像中的坐标系称为像素坐标系,但是本文延续大多数把数字图像的坐标系称为图像坐标系的习惯,就把此坐标系称为物理图像坐标系),即上图左图中的坐标系O_1,其横纵轴用X,Y来标识,单位一般为mm(根据具体成像设备而定,不过单位不会影响坐标系的转换)。

再介绍世界坐标系相机坐标系,如上图右图所示,坐标系O为相机坐标系,为一个3维坐标系,各维度分别用x,y,z表示,z轴称为摄像机光轴,与图像平面垂直,并且交点O_1为物理图像坐标系的原点。
上图右图左上角为世界坐标系,可以用来描述环境内的任何物体的位置,包括相机的位置,其各轴用X_w,Y_w,Z_w来标识。并且世界坐标系可以通过旋转与平移转换为相机坐标系。

二、坐标系转换

2.1 世界坐标系转为相机坐标系

点P为空间中的任一点,设其世界坐标系下的坐标为(X_w,Y_w,Z_w), 相机坐标系下的坐标为(x,y,z), 则可以通过相机坐标系与世界坐标系的关系可以由(X_w,Y_w,Z_w)计算(x,y,z):
在这里插入图片描述
R, t 分别为3×3的旋转矩阵和3×1的平移向量。

2.2 相机坐标系转为物理图像坐标系

由第一节中图的右图所示,p为P在图像平面上的投影,设p的物理图像坐标为(X, Y), P的相机坐标系坐标为(x, y, z),则根据比例关系得:
在这里插入图片描述
其中f为焦距,转为齐次坐标+矩阵形式为:
在这里插入图片描述

2.3 物理图像坐标系转为图像坐标系

设物理图像坐标系的原点在图像坐标系的位置为(u_0,v_0)(一般在图像的中心,不过有时候会存在偏差等)。对于物理图像坐标系中的任意一点(X,Y)都可以转换为图像坐标系中的坐标(u, v):
在这里插入图片描述
其中dX, dY 是成像元件的每个像素所对应的物理宽高,单位一般为mm。u_0, v_0, dX, dY 均为相机的固有参数。
通过齐次坐标将其写成矩阵形式:
在这里插入图片描述

2.4 总结

结合上述公式即可以将任意一点的世界坐标转换为图像坐标:
在这里插入图片描述
M1,M2分别仅与相机的内外参数相关。
由上式可知,当给出目标的世界坐标时,可以得到三个方程,消去z后可求得(u, v)

怎么消去z ? : 因为上式中都是齐次坐标的形式,齐次坐标的性质是 乘以非零常数后表达的含义不变,所以可以在2.2节中两端同乘以 1/z 消除z,相当于对z那一维进行了归一化处理,此时得到的 [X, Y, 1]也就是点在相机的归一化平面上的投影点,位于相机前方z=1的平面

反之给出图像坐标(u, v)并不能求得其唯一的世界坐标,因为矩阵M为3×4维,不可逆,仅能解得一个射线方程,即该射线上的点投影均为(u, v)

2.5 为什么要使用齐次坐标

(个人思考)
假如不使用齐次坐标的话,物理图像坐标系转为图像坐标系的矩阵将为2×3维,而相机坐标系转物理图像坐标系的矩阵变为2×3维,这两个矩阵分别为2.4节公式第一行等号右边的前两个矩阵,可以看出,不使用齐次坐标的话矩阵无法相乘,那就无法完成坐标转换。

参考文献

《机器视觉理论及应用》 电子工业出版社

本文仅为本人学习过程中的笔记以及一些个人思考,文中如有错误的地方还请指正

  • 13
    点赞
  • 88
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
首先,需要了解相机坐标系世界坐标系的概念: - 世界坐标系:是一个三维坐标系,表示我们所要显示的物体在现实中的位置和大小。 - 相机坐标系:也是一个三维坐标系,表示相机的位置和方向。 转换的过程可以通过以下步骤完成: 1. 定义相机参数:包括相机位置、相机朝向、相机视角等。 2. 定义世界坐标系中的物体:可以是一个平面、一个立方体等。 3. 将世界坐标系中的物体转换相机坐标系中:这个过程包括旋、平移和缩放等操作。 4. 绘制转换后的物体。 下面是一个简单的 Python 代码示例,演示如何将一个平面从世界坐标系转换相机坐标系,并绘制出转换后的结果: ```python import cv2 import numpy as np # 定义相机参数 camera_pos = np.array([0, 0, 0]) camera_dir = np.array([0, 0, 1]) camera_up = np.array([0, -1, 0]) camera_fov = 60 # 定义世界坐标系中的物体 world_plane = np.array([ [-1, -1, 0], [-1, 1, 0], [1, 1, 0], [1, -1, 0] ]) # 将世界坐标系中的平面转换相机坐标系中 view_matrix = cv2.lookAt(camera_pos, camera_pos + camera_dir, camera_up) projection_matrix = cv2.perspectiveTransform( np.array([world_plane]), view_matrix, camera_fov) camera_plane = projection_matrix[0] # 绘制转换后的平面 img_size = (640, 480) img = np.zeros((img_size[1], img_size[0], 3), dtype=np.uint8) scale_factor = img_size[0] / 4 offset = np.array([img_size[0] / 2, img_size[1] / 2]) for i in range(camera_plane.shape[0]): x, y = (camera_plane[i, :2] * scale_factor + offset).astype(int) cv2.circle(img, (x, y), 5, (0, 0, 255), -1) for i in range(4): x1, y1 = (camera_plane[i, :2] * scale_factor + offset).astype(int) x2, y2 = (camera_plane[(i + 1) % 4, :2] * scale_factor + offset).astype(int) cv2.line(img, (x1, y1), (x2, y2), (255, 0, 0), 2) # 显示图像 cv2.imshow("Image", img) cv2.waitKey(0) ``` 这段代码将一个平面从世界坐标系转换相机坐标系,并在图像中绘制出转换后的结果。你可以根据需要修改代码,实现更复杂的场景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值