关于计算机视觉中的深度信息概念

最新推荐文章于 2025-04-29 09:22:12 发布

sjh_sjh_sjh

最新推荐文章于 2025-04-29 09:22:12 发布

阅读量1w

点赞数 13

分类专栏：深度信息文章标签：计算机视觉

本文链接：https://blog.csdn.net/sjh_sjh_sjh/article/details/108621023

版权

深度信息专栏收录该内容

1 篇文章

订阅专栏

本文探讨了单目相机与双目相机在目标检测中获取深度信息的原理与限制。单目相机仅能获取物体与地面接触点的横纵向距离，而无法完整还原三维信息。双目相机通过模仿人类双眼的视差效应，能够精确获取物体的三维坐标，包括深度信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

引用：https://blog.csdn.net/a1059682127/article/details/80503378
https://www.zhihu.com/question/406919125/answer/1338670936
----单独使用单目相机进行目标检测时候，可以通过对相机标定的方式，获取所检测物体（物体与地面接触点）距离相机的横纵向距离信息（x，y）;
----但是不与地面接触的物体部分的X，Y，Z轴，或者说物体大部分的位置信息（只能拿到与地面接触部分的距离信息，高度默认为0）无法获取，原因是相机在获取图像的时候会将物体的三维信息降维至二维图像信息，此时物体大部分的深度信息将无法逆向复原！

原因：基本透视投影——》透视投影是多对一的关系，投影线上的任何一点对应同一个像点。
如果用两个摄像机，则可以消除这种多对一，确定三维坐标的值，即深度信息。
双目为什么可以感知深度信息呢？我们的左右眼从略微不同的角度观察景物，而这种视差与物体所处的位置有关。

通常来说图像都是通过摄像头给拍出来的，虽然我们日常生活中事物都是三维的，但是通过摄像头给拍出来的图像却是二维的，因此在拍摄的过程中我们其实丢失了一维的信息，而这个一维的信息就是物体在空间里的相互距离，比如下图左上角的卧室照片，我们可以看到卧室里有哪些东西，但是我们****很难估计里面各个物体之间的距离是什么，比如床和电脑桌之间的距离，我们可以看到大概的方位，但是没有办法准确的估计距离，而这里的距离信息也就是深度（Depth）所指的含义，为了方便计算，通常深度在机器视觉里面都是指空间里面的各个点相对于摄像头的距离，知道了这个信息之后就可以很方便的计算各点之间的相互距离了。
注意：深度信息需要获取到空间中的各个点相对于相机的距离，然而单目视觉只能获取与地面接触点的距离信息。
在这里插入图片描述