论文阅读：DenseFusion

最爱那个微笑的麦蒂

已于 2022-10-12 14:05:21 修改

阅读量575

点赞数 1

分类专栏：论文阅读笔记文章标签：论文阅读深度学习计算机视觉

于 2020-07-22 10:56:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012894550/article/details/107505106

版权

论文阅读笔记专栏收录该内容

7 篇文章 1 订阅

订阅专栏

论文阅读：DenseFusion

DenseFusion: 6D Object Pose Estimation by Iterative Dense Fusion

1、现存问题

根据RGB-D图像获得6D物体姿态估计的主要挑战是融合两个数据源
从RGB数据源获取信息时，遇到严重遮挡和光照问题时影响性能
refine的步骤不能和前期程序构成一体优化，影响实时性效率

2、创新点

设计了一个像素级别的RGB和深度信息融合端到端网络能够更好的处理严重遮挡问题
提出了一种迭代方法能够在端到端网络中更好的处理姿态优化问题，替代了之前方法对后续ICP refine步骤的依赖

3、内容

3.1 网络架构

网络架构主要分为两个阶段：
第一阶段用RGB图像作为输入并进行语义分割然后针对每个分割后的物体转换成3D点云给第二阶段
第二阶段处理分割结果并估计物体的6D pose。它包括四个组成部分：(A)处理颜色信息并将图像裁剪中的每个像素映射到颜色特征嵌入的全卷积网络，(B)基于PointNet的网络将蒙板3D点云中的每个点处理为几何特征嵌入，c)一个像素级融合网络，该网络结合嵌入并输出对该网络的6D姿态的估计基于无监督置信度评分的对象，以及d)迭代自精炼方法，以课程学习的方式训练网络，并迭代地细化估计结果

3.2 语义分割

这个部分主要用的PoseCNN的现成的

3.3 稠密特征提取

密集的3D点云特征嵌入：之前的方法都是用CNN来处理深度信息，作为额外的图像通道，这样做忽视了深度通道的内部3D结构。另外我们第一次使用已知相机内参将分割后的深度像素转换成点云并用类Pointnet的机构来提取结构特征。
密集彩色图像特征嵌入：彩色嵌入网络的目标是提取每个像素的特征，这样我们就可以在三维点特征和图像特征之间形成密集的对应。图像嵌入网络是一种基于CNN的编解码结构

3.4 像素级的深度融合

文章的核心观点是利用局部每个像素的融合，而不是全局像素融合，这样，我们就可以潜在地选择基于对象可见部分的预测，并最小化遮挡和分割噪声的影响
逐个像素的自监督置信分被用来确认哪一个姿态估计是基于特定上下文的最佳假设

3.5 6D姿态估计

这个地方是逐像素的损失函数，同时针对对称物体的损失函数使用的和普通的不同，是使用的最近点法作为匹配点，有点儿类似ICP的优化目标

3.6 迭代优化

这个地方是逐步优化的，使用RT矩阵连乘的形式，不但减少残差

4、实验和细节

自己训练一次好久啊…

最爱那个微笑的麦蒂

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
论文阅读：DenseFusion

论文笔记：DenseFusionDenseFusion: 6D Object Pose Estimation by Iterative Dense Fusion1、现存问题根据RGB-D图像获得6D物体姿态估计的主要挑战是融合两个数据源从RGB数据源获取信息时，遇到严重遮挡和光照问题时影响性能refine的步骤不能和前期程序构成一体优化，影响实时性效率2、创新点设计了一个像素级别的RGB和深度信息融合端到端网络能够更好的处理严重遮挡问题提出了一种迭代方法能够在端到端网络中更好的处理姿态优化问
复制链接

扫一扫

专栏目录

最爱那个微笑的麦蒂

博客等级

码龄11年

25
原创

29
点赞

92
收藏

12
粉丝

关注

私信

热门文章

分类专栏

最新评论

论文阅读：GeoTransformer
#@?: 同问，我点击Geo_Transformer里P2PNet模型链接，发现跳转的是Patch2pix模型，我在P2PNet是不是这个模型哦
论文阅读：GeoTransformer
lzk_kzl: 大佬请问为什么使用他的downsample_pcd.py文件没有生成下采样的KITTI数据点云数据,显示0it[00:00,?it/s]
论文阅读：GeoTransformer
CPFWWS: 您好，我在该论文Tab9表中看到了名为p2pnet的模型，并且在paper with code上 GeoTransformer - P2PNet也出现了p2pnet的字样，您知道这代表什么么，在作者的论文中似乎没有相关解释
论文阅读：GeoTransformer
最爱那个微笑的麦蒂: 主要吃显存大小

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。