MatchU学习

最新推荐文章于 2024-08-30 12:38:37 发布

momo_vv

最新推荐文章于 2024-08-30 12:38:37 发布

阅读量560

点赞数 21

文章标签：学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44695308/article/details/137066976

版权

文章目录

论文题目
概况
背景 (说明所做的问题、解决该问题的意义、简述现有方法存在的问题)
- 1.问题
主要创新点（先一句话描述该文所做的事情，再分点讲创新点）
方法

论文题目

MatchU: Matching Unseen Objects for 6D Pose Estimation from RGB-D Images

概况

类别：论文
标签：6-Dof、Pose Estimation、novel instance
发表刊物 / 会议时间：2024

背景 (说明所做的问题、解决该问题的意义、简述现有方法存在的问题)

1.问题

目前姿态估计工作致力于处理novel instance，现有的方法中，基于手工特征+PPF、基于sfm+matching、基于模板的方法都需要较大的计算开销
基于描述符的方法可以用于将对象的深度像素与其3D模型相匹配，但描述符还需要旋转不变性来减轻旋转歧义，以及目前的方法没有充分利用RGB信息
我们的目标是通过设计一个旋转不变和对称感知的主干，有效地融合RGB和深度信息，实现两全其美。

主要创新点（先一句话描述该文所做的事情，再分点讲创新点）

一句话：
提取旋转不变描述符，这些描述符可以在广泛范围的对象之间共享，从而促进对未见对象的泛化。为了解决旋转不变性引入的歧义问题，引入了一种新型的2D-3D融合模块，并提出了一种新颖的桥接粗匹配损失，利用RGB信息增强几何描述符的学习。
创新点

提出了MatchU，一种6D姿态估计融合描述-匹配策略，该策略提取融合的RGB-D输入特征，旨在将未见的3D CAD模型注册到场景中的对象。
新型的潜在融合注意力模块，用于有效地融合纹理和几何特征，以从RGB-D数据中实现通用姿态估计，并用桥接粗匹配损失训练MatchU。
学习融合特征表示而固有地捕捉对称性，而不需要额外的注释

方法

旋转不变描述符的提取至关重要，因为它允许我们的方法在不依赖显式对称注释的情况下固有地捕捉和建模对象的自然对称性
提出了一个2D-3D fusion模块，Latent Fusion Attention Module，结合几何和纹理特征，减轻对称引入的模糊
我们提出了一种新的桥接粗略水平匹配损失，它利用RGB信息来增强几何描述符的学习

1. 问题描述&overview

输入：CAD（点云P）、RGB_crop、D_crop（点云Q）
建立P、Q对应关系，实现位姿估计

在这里插入图片描述

提取P、Q的特征
根据特征的相似性建立P和Q的对应关系
最小二乘优化、

2. 特征提取

2.1 3D特征

利用基于transformer的RoITr获得旋转不变的局部3D几何描述符

P、Q经过FPS降采样得到超级点
超级点在半径为r的邻域内提取局部特征
然后通过一系列注意力块将局部几何线索投影到潜在空间中，我们从中获得固有旋转不变的局部3D几何描述符

2.2 2D特征

基于CNN，FPN[37]的改进编码器作为CNN主干，并投影到和3D特征同纬度的空间

2.3 潜在融合注意力模块

为了保持我们网络的可推广性并避免对特定对象特征的过度拟合，我们建议在粗略水平的潜在空间中融合3D和2D特征，并利用3D到2D融合块以及2D到3D融合块来融合两个角度的信息。
如图所示，特征先经过位置编码后输入到模块中，模块中涉及两种子模块

Global Transformer：蓝色，融合3D和3D特征、
Latent Fusion Transformer：绿色，融合2D和3D

在这里插入图片描述

3. 描述子学习

以RGB特征作为桥梁，两个loss

3.1 Bridged Coarse-level Matching Loss（BCM）

为了保证基于RGB的2D信息在潜在空间中的有效性，关键是通过建立2D和3D特征之间的跨模态匹配来提供来自2D和3D模态的监督信号。、

3.2 Fine-level Matching Loss

且在这一步将超级点decode到原始点云P、Q

4. Matching Descriptors and Estimating 6D Poses

我们使用协方差分析来测量归一化特征的相似性。我们将前k个最相关的点对确定为点集C的3D-3D匹配，从中我们创建η姿态假设。
对于1≤v≤η的每个假设T，我们首先从C中随机选择s≪κ对应关系，然后使用RANSAC[14]优化求解6D对象姿态的方程
所有的假设做分数排序

关注

21
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
MatchU学习

为了保证基于RGB的2D信息在潜在空间中的有效性，关键是通过建立2D和3D特征之间的跨模态匹配来提供来自2D和3D模态的监督信号。为了解决旋转不变性引入的歧义问题，引入了一种新型的2D-3D融合模块，并提出了一种新颖的桥接粗匹配损失，利用。为了保持我们网络的可推广性并避免对特定对象特征的过度拟合，我们建议在粗略水平的潜在空间中融合3D和2D特征，并利用。来测量归一化特征的相似性。我们将前k个最相关的点对确定为点集C的3D-3D匹配，从中我们创建η姿态假设。根据特征的相似性建立P和Q的对应关系。
复制链接

扫一扫

momo_vv CSDN认证博客专家 CSDN认证企业博客

码龄6年

14: 原创

118万+: 周排名

7万+: 总排名

1万+: 访问

: 等级

276: 积分

110: 粉丝

129: 获赞

4: 评论

181: 收藏

私信

关注

热门文章

分类专栏

6pack 9篇

最新评论

pose 整理（补充中）
CSDN-Ada助手: 恭喜您写了第10篇博客！持续创作不易，看到您对pose整理的探索和补充，让我感到十分期待。希望您在未来的创作中，可以继续深挖pose的内容，探索更多新颖的观点和技巧，让读者们能够从您的博客中获益良多。加油！继续努力！
BundleTrack学习
CSDN-Ada助手: 恭喜你写完了第9篇博客！标题“BundleTrack学习”让我很感兴趣。你的持续创作真是令人敬佩！阅读你的博客，我对BundleTrack有了一定的了解，感谢你分享了这个学习经历。作为一个读者，我很期待你未来的创作。也许你可以考虑深入探讨BundleTrack的实际应用场景，或者分享一些你在学习过程中遇到的挑战和解决方案。保持谦虚的态度，继续努力！期待你的下一篇博客！
6-PACK论文学习及复现记录
Richardder: 想问一下博主最后的可视化结果具体怎么得到了，文章说修改eval.py(TEST_2)这里没看明白

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。