PTAM 后记
放一下我的演示视频:
PTAM+Android+Ogre毕业设计—在线播放—优酷网,视频高清在线观看
论文答辩完已经一个多月了.这篇后记刚开始计划论文时就想着写,也就是15年12月开始.本来想记录点遇到的问题整理出来.还有写的时候记点论文无关的东西.但是写着写着忘了.问题整理也比较乱.这篇文章主要就发演示视频.再即将离校之际写点东西.
大学四年就这么结束了.总结下大学的学习经历吧.
大二时,撇了一眼 linux 和 android 底层的一些设计.哇,好牛!发誓劳资要搞底层,构建软件系统的基础!只会调API写应用的都是渣渣!
然后大三时找不到相关实习,于是找了个做图像相关的小公司,做视觉跟踪和三维重建相关.然后发现这个更牛逼更好玩!不过公司也只敢说是做图像相关的产品而已.实际非常非常水.乱成一团,几个人在瞎搞.
虽然公司差,但我学习的激情瞬间被点燃,以一个三流本科生的基础苦学半年企图踏入这行学术领域.现在过了半年,又跳槽换方向了,也算见识了见识了大大小小的不少工程,其实每个领域都有让人叹为观止的设计,至少能让我老老实实学个一年也未必精通.更何况是这么复杂的SLAM.
扯远了.总之实习时做的一个项目就是PTAM相关,老板要求用PTAM实现AR效果,用Ogre实现,然后让我做,就这么弄出来了.实习完空闲了一段时间,那时就开始好好学习一下CV,顺便折腾论文.论文里的图片效果看起来很渣,我一直想把PTAM的画面和姿态渲染到gamekit里,然后用blender做场景,lua写脚本,可以很轻松写出一个AR游戏.然而工作忙,还有别的事情,于是,这个想法被无限拖延了.
未解决的问题
(这里未解决的问题不是指现代SLAM系统未解决的技术问题,而是我个人未能理解的算法.)
- 首先是relocalisation.第二篇PTAM论文中,Georg 介绍了一种重定位方法,用于跟踪丢失时重新找到摄像头姿态。其实现代码在SmallBlurryImage.cc 和Relocaliser.cc两个文件,加起来也就几百行代码.但是我看了几遍都没看明白.其实现主要参考这篇文章:Homography-based 2d visual tracking and servoing .pdf 。涉及李群李代数。
- 在5.5节单应性矩阵分解得到RT矩阵的方法中,对矩阵H做SVD分解。根据奇异值不同取值情况和可视区域条件可以找出最优[R|T]矩阵。那几个条件一直看不懂.论文: Motion and structure from motion in a piecewise planar environment_PTAMref_Homography_Docomposition.pdf