1、深度估计:输入彩色图像,输出深度估计(像素点离相机距离:得出一个数值),深浅即为远近(越亮越近)。
demo:演示,示范
2、KITTI数据集:车载拍摄数据集
3、如何实现:
- 输入就是单张图片
- 输出各像素点深度值
- 过程就是编码解码
- 分层*
backbond:提取特征
难点:轮廓识别 怎么得到边界轮廓->差异(做差推出轮廓边界)对输入做上下采样后算差异(类似于unet)
上采样(卷积+差值)特征图变大, 下采样(卷积+池化)特征图变小
SPP:做多种不同的池化看
空洞卷积
ASPP