DenseFusion是2019年李飞飞等提出的用于6D姿态估计的网络。它是一种端到端的结构,输入为RGB-D数据,输出为某个物体的6D姿态。主要贡献就是针对颜色特征和几何特征提出了一种像素级稠密融合的方式。在LineMOD数据集和YCB-Video数据集上进行了实验。
本文对该网络进行完整的复现,详细解析了源代码中的重要内容。由于本人刚接触姿态估计方面的内容,因此有些解析部分包含很基础的知识,放在【DenseFusion详解】专栏。除此之外,本文在源代码的基础上进行了后续评价指标的计算以及结果的可视化,这些代码都是本人自己写的,放在【DenseFusion进阶】专栏。
以下是整个系列的目录:
【DenseFusion详解】
1-【实际操作】DenseFusion复现过程详解-LineMOD数据集
2-【DenseFusion代码详解】训练过程train.py
3-【DenseFusion代码详解】linemod数据集预处理过程
6-【DenseFusion代码详解】refine过程loss计算
7-【DenseFusion代码详解】测试过程eval_linemod.py
【DenseFusion进阶】
1-【实际操作】DenseFusion复现过程详解-YCB-Video数据集
2-【DenseFusion代码详解】YCB-Video数据集预处理过程