深度视觉基础(一)——RGB-D
一、什么是RGB-D
RGB :
RGB色彩模式通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的。
Depth Map:
在3D计算机图形中,Depth Map(深度图)是包含与视点的场景对象的表面的距离有关的信息的图像或图像通道。其中,Depth Map 类似于灰度图像,只是它的每个像素值是传感器距离物体的实际距离。通常RGB图像和Depth图像是配准的,因而像素点之间具有一对一的对应关系。
深度图像 = 普通RGB三通道彩色图像+Depth Map
二、特性及应用
1.特点
深度图像的优点:规避了纯视觉技术的弱点(缺乏纹理、光照不足、过度曝光、软件计算复杂度高、快速运动的问题)。
深度图像的缺点:受深色物体、(半)透明物体、镜面反射物体、视差等影响。深度图质量与硬件密切相关。成本和功耗高。
该处使用的url网络请求的数据。
2.应用
三维重建
姿态估计
目标检测
人体感应
图像分割
SLAM
前景提取
目标跟踪
三、获取途径
①结构光法 Kinect v1,iPhone X
②ToF法 Kinect v2 , phab 2pro
③双目,单目深度估计
总结
图像深度 是指存储每个像素所用的位数,也用于量度图像的色彩分辨率。
图像深度 确定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。它决定了彩色图像中可出现的最多颜色数,或灰度图像中的最大灰度等级。比如一幅单色图像,若每个像素有8位,则最大灰度数目为2的8次方,即256。一幅彩色图像RGB三通道的像素位数分别为4,4,2,则最大颜色数目为2的4+4+2次方,即1024,就是说像素的深度为10位,每个像素可以是1024种颜色中的一种。
例如:
一幅画的尺寸是1024*768,深度为16,则它的数据量为1.5M。
计算如下:
1024×768×16 bit = (1024×768×16)/8 Byte = [(1024×768×16)/8]/1024 KB = 1536 KB = {[(1024×768×16)/8]/1024}/1024 MB = 1.5 MB