6DoF Object Pose from Semantic KeyPoints——自我理解

最新推荐文章于 2022-07-27 12:30:16 发布

是蓝天白云也是希望

最新推荐文章于 2022-07-27 12:30:16 发布

阅读量738

点赞数

分类专栏：机器学习相关论文文章标签：位姿估计论文语义关键点

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Marilynviolet/article/details/101380092

版权

目的：从RGB图片中估计6d位姿
方法：首先利用图片集训练网络对图片纹理的感知，将可变模型（基于外观的概率或统计模型）和由卷积网络预测的语义关键点结合，然后利用语义关键点推测类内的形状变量，相机位姿是由弱透视或全方位的相机模型模型化，通过最大化参数化可变模型和2d语义关键点的几何一致性进而估计6d位姿。
贡献：第一，上面的方法；第二，无需任何位姿初始化就能在混乱场景中精确定位6d位姿

手段：主要三个步骤：对象检测，关键点定位，位姿优化
A.关键点定位
网络名称：‘stacked hourglass’
网络结构：RGB图片（输入）——>热度图集（输出）代表关键点的可信度，由前一部分和后一部分组成，前者输出中间热度图，后者输出优化后的热度图。
B.位姿优化
PnP：容易受闭环和错误检测影响
Ours：用一个易变形的模型去匹2d检测
说明：每个对象使用3D CAD模型＋注释的关键点来生成一个形状易变的模型，第p个关键点在3D模型上的定位由S表示

B0是初始值ÿ

最低0.47元/天解锁文章

是蓝天白云也是希望

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
6DoF Object Pose from Semantic KeyPoints——自我理解

**目的：**从RGB图片中估计6d位姿**方法：**首先利用图片集训练网络对图片纹理的感知，将可变模型（基于外观的概率或统计模型）和由卷积网络预测的语义关键点结合，然后利用语义关键点推测类内的形状变量，相机位姿是由弱透视或全方位的相机模型模型化，通过最大化参数化可变模型和2d语义关键点的几何一致性进而估计6d位姿。贡献：第一，上面的方法；第二，无需任何位姿初始化就能在混乱场景中精确定位6d位...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。