图像处理和视频处理既有联系也有区别。
估计图像深度时,
- 单眼/目图像——一个摄像头拍摄的图像
- 双目图像——两个摄像头拍摄的图像
估计视频深度时,
- 将视频视为一组帧,帧但看其实就是一张图像,进而初步可以进行图像深度估计
- 随后,需要考虑帧之间的连续性
那么问题来了,读论文看到估计静态视频深度?这和估计单张图像深度有什么区别?
- 静态视频=单张图像视为帧后*N?(肤浅)
- 视频和单张图像形成的过程本不一样,过于理所当然的换算是盲目理性!
- 视频方向,说是静态场景,但其实质帧之间还是有所差异的,不是所谓的单张图像的复制粘贴,只不过静态场景相比于动态场景更好处理,却又不像单张图像那样容易,帧之间的联系是不容忽视的部分。
- 而且静态场景,不代表拍摄全程不动:
- 拍摄的物体是静态的,而拍摄镜头是动的,这将考虑视点问题。
- 拍摄的物体是静态的,而拍摄镜头也不动的,依旧会有光照、晃动等因素。