先引一下自己的前文:
一个"完美"的VIO,其实是一个既要又要还要且要的东西,非常的恶心:
1.既要位姿准确(ORB-SLAM3, VINS-MONO)
2.又要能够半稠密建图(DSO, DM-VIO)
3.还要能够工程化,克服各种极端情况,ZUPT等 (PR-MONO1)
4.且要低开销(只能在高性能高算力平台上跑的东西根本没有足够商业价值-除自动驾驶,违背VINS/VIO等基础设计宗旨)
其实这里就包含了三相性:开销度,鲁棒度,精度
三相性可以理解为VIO系统的人生观和价值观,哈哈
分别对应了4,3,1,对应的主体手段是并行化/芯片化,ZUPT,精度涉及的东西太多不讨论。
在工程中顺序分先后,刚好和学术落地相反,原因前文也说过了,不赘述,言简意赅是现在写东西的追求。
大的软硬件版本已经解决了三相性,这2天连极端防震都做完了,进入了极佳的工程和落地条件。那么整个工程进入了最后一个课题:世界观,也就是对应2的部分。
其实做到这里,整个人和小组都进入了相对丧的状态,其实连三相性都解决了,应该是很高兴的状态才对,但为什么会这样呢?
(1) 首先,VIO/VSLAM或双目VSLAM,最大的难点并不是世界观,而是构建了世界观后如何保持三相性的问题!世界观早就架起来了,但是不能满足三相性的世界观,又是个停留在PAPER上的东西。
(2) 用分立的D相机去构建世界观,先不提ICP巨大的开销(用更好的数据结构如KD TREE和八叉树也一样),要解决三相性中最重要的开销度,那就会对NV的CUDA生态以及开普勒架构深依赖。其实更加差的问题是D相机普遍手短,能好好地解决个避障就不错了。
(3) 那就只剩下用纯VO与视觉BA去构建世界观并保持良好的三相性了,准备开始闭关,争取明年3月底前闭环。。。以后写的文章估计都是些旁支路了。丧的更深层原因是即使纯视觉的世界观构建起来了并达到了相当的距离,相对雷达与D相机,还是会存在一个巨大的纹理内实心空心的死穴。。。
算了,不去想了,车到山前必有路,船到桥头自然直。