PatchFusion: An End-to-End Tile-Based Frameworkfor High-Resolution Monocular 深度估计(CVPR 24)
模块A是简单的卷积层和池化的堆叠,输入原始分辨率图像的切片的堆叠,Dc和Df,(图a中最下面那个Ng就是b Guided Fusion Network)。模块A的输出和粗糙特征Fc输入模块B,Fc经过G2L模块,得到的特征,由于粗糙特征分辨率小,因此参考了mask-rcnn中的roi操作,将低分辨率的特征和高分辨率的切块特征对齐。模块c的输入为B的输出,直接对粗糙特征使用roi,Ff和低尺度上采样。需要注意的是:这里深度估计的上下文(context),指的是估计出深度信息所必要的周围的信息,如纹理梯度等。
原创
2024-05-23 10:48:37 ·
570 阅读 ·
0 评论