PoseNet: A Convolutional Network for Real-Time 6-DOF Camera Relocalization

最新推荐文章于 2024-06-07 09:46:07 发布

seamanj

最新推荐文章于 2024-06-07 09:46:07 发布

阅读量1.9k

点赞数

分类专栏： CV deep learning paper

paper 同时被 3 个专栏收录

106 篇文章 1 订阅

订阅专栏

40 篇文章 0 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

https://zhuanlan.zhihu.com/p/53044278

https://zhuanlan.zhihu.com/p/45483149

abstract: 训练了一个神经网络可以从单张图像端到端的回归出相机的位置和姿态，有别于SLAM，不再需要额外的工程操作或者图优化。室外精度达到2m，3°。室内精度达到0.5m，5°偏差。网络是23层，利用transfer learning from recognition to re-localization 在目标分类的网络上pre-train的模型。比依赖sift关键点提取，匹配的方法更robust。

Contribution:

1）利用transfer learning 任务从目标识别，迁移到re-localization。

利用structure from motion根据图像序列/视频，自动生成训练label（camera pose），减少了人类标注的工作。

3）避免传统SLAM的pipeline: 比如需要存储densely spaced keyframes, appearance-based localization, landmarked-based pose estimation, frame-to-frame feature correspondence.

Loss function:

在这里插入图片描述
作者实验发现把位置和姿态分成两个网络进行训练的效果并不好，猜测是位置和姿态的耦合关系，所以还是要放在一起训练。

网络结构：

GoogLeNet pre-trained for classification 改造成regression问题。

replace the three softmax classfiers with affine regressors.
在最终输出层之前插入了一个全连接层，before the regressor.用来当作local feature vector.

一个比较有趣的应用就是你在指定区域拍张照后, 然后得到google map里街景的一个结果
http://mi.eng.cam.ac.uk/projects/relocalisation/#results

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
PoseNet: A Convolutional Network for Real-Time 6-DOF Camera Relocalization

https://zhuanlan.zhihu.com/p/53044278https://zhuanlan.zhihu.com/p/45483149abstract: 训练了一个神经网络可以从单张图像端到端的回归出相机的位置和姿态，有别于SLAM，不再需要额外的工程操作或者图优化。室外精度达到2m，3°。室内精度达到0.5m，5°偏差。网络是23层，利用transfer learning fr...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。