2021年10月_m_buddy

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创《From Big to Small：Multi-Scale Local Planar Guidance for Monocular Depth Estimation》论文笔记

参考代码：bts1. 概述导读：从2D图像中估计出深度信息是多解的，对此文章提出了在解码器的多个stage上加上隐式约束，从而引导解码器中适应深度估计特征的生成，从而产生更佳的深度估计结果。其中的隐式约束即为LPG（local planar guidance）层，但是该层实现与其配套的操作较为复杂，直接运用于部署存在较大难度，不过用于teacher网络指导student网络是一个不错的选择。将LPG层的输出取出，得到下图中第二行的结果：可以看到在stride=8stride=8stride=8

2021-10-31 23:22:13 1074

原创《Unsupervised Monocular Depth Learning in Dynamic Scenes》论文笔记

参考代码：depth_and_motion_learning1. 概述导读：这篇文章是在（Depth from Videos in the Wild）的基础上进行改进得到的，在之前的文章中运动区域/物体通过mask标注或是bounding box标注的形式确定，但是这样或多或少会存在对外依赖的问题。对此，文章从刚性物体运动在相机前运动的特性进行分析得出如下两个特性：1）其在整幅图像中的占比是较少的，毕竟一般情况下不会运动的背景占据了较大的比例；2）刚性运动的物体其内部运动特性是分段的常量值，也

2021-10-24 05:00:00 907 1

原创《Depth from Videos in the Wild：Unsupervised Monocular Depth Learning from Unknown Cameras》论文笔记

参考代码：depth_from_video_in_the_wild1. 概述导读：在这篇文章中提出了一种自监督深度估计算法，总体上看文章的算法是与monodepth2方法存在一定程度关联性，它们都是采用视频帧之间的相关性来建立自监督关系的。文章的方法经过凝练主要的工作主要体现为如下几点：1）将相机位姿（旋转和平移矩阵）与相机内参（如果想的话可预测畸变参数）均通过网络预测的形式进行表达，增加对输入数据的适应性；2）采用几何特性（也就是两帧像素计算光度重构损失的时候选择深度最小的为有效像素点）避免遮挡

2021-10-21 23:29:35 599 1

原创《RAFT-Stereo：Multilevel Recurrent Field Transforms for Stereo Matching》论文笔记

参考代码：RAFT-Stereo1. 概述导读：RAFT算法是非常经典的立体匹配算法，在光流和立体匹配任务中有着广泛的运用。而这篇文章正是基于RAFT并将其运用到了立体匹配中，并且在如下的几个方面进行改进：1）相比原生的RAFT算法钟重点关注X轴（W方向）的视差信息，前提是输入的图像对需要事先经过极线校准；2）在GPU的update阶段使用stride为[8,16,32][8,16,32][8,16,32]的特征图进行运算，这样可以在迭代优化的同时更加增大网络感受野，从而增加对与大范围无/弱纹理区

2021-10-18 22:13:32 2355 6

原创《Single Image Depth Prediction with Wavelet Decomposition》论文笔记

参考代码：wavelet-monodepth1. 概述导读：对一幅深度图进行分析可以观察到其是由一些平滑区域和边缘区域组合起来的，对应的可以参考频域中的低频和高频分量。而这篇文章正是提出一种基于频域分析（2D haar小波分析）的深度估计算法，不同于直接监督深度图的频域分解分量，文章的方法通过对分辨率最小的深度图进行监督，之后通过在网络的不同层级上预测频域的分量，使得可以从分辨率最小尺度下进行逆频域变换得到对应的深度结果（也就是深度的频域分量不直接参与回归，而是通过将不同频域的不同分量组合得到的深度图

2021-10-15 22:46:48 658

原创《ReDet：A Rotation-equivariant Detector for Aerial Object Detection》论文笔记

参考代码：ReDet1. 概述导读：这篇文章针对旋转目标检测问题提出了一种新的检测算法ReDet（Rotation-equivariant Detector），在该算法（为二阶段检测算法）中对旋转目标检测问题进行了细致分析，从特征抽取的backbone、fpn网络开始，到后期特征对齐阶段都进行了改进。具体来讲就是使用具有平移、旋转、镜像不变属性的网络单元构建特征抽取网络，从而使得特征抽取网络具有rotation-equivariance。之后在RRoI Align（rotation RoI）的基础上构

2021-10-13 01:46:30 891 8