注:本文内容大多数来源于“计算机视觉life”微信公众号,因文章较多,笔者记忆又不强,所以整理成博客形式,感兴趣的伙伴可以移步微信公众号浏览更多精彩内容哦!
一.为什么要学SLAM?
计算机视觉主要分为两大方向:基于学习的方法(代表:深度学习)和基于几何的方法(代表:视觉SLAM)
1.深度学习在检测、识别领域具有强大能力,但涉及多视角几何相关的SLAM领域,深度学习作用非常有限,SLAM需要清晰的理论基础保证,而深度学习[黑盒子]模型目前还不奏效。
2.SLAM技术门槛高。需要具备三维空间刚体变换、相机成像模型、特征点提取与匹配、多视角几何、捆集调整等内容。
3.消费级RGB-D相机快速发展催生了以三维视觉为基础的商业化应用。
4.目前据算计视觉领域主要还是通过二维图片来感知世界,而三维视觉才是人类感知理解世界的正确方式,因此以三维视觉为基础的SLAM技术是机器人、无人驾驶、AR等人工智能细分领域的核心技术。
5.SLAM需求公司:互联网公司如百度、腾讯、阿里、京东等,计算机视觉算法公司如旷世、虹软、商汤等,自动驾驶创业公司如图森、momenta、景驰、驭势、滴滴及各大汽车厂商等,无人机/机器人公司如大疆、思岚、高仙等,AR移动终端应用相关公司如三星、华为、悉见等。
二.SLAM到底做什么?
SLAM是指当某种移动设备(如机器人、无人机、手机等)从一个未知环境里的未知地点出发,在运动过程中通过传感器(如激光雷达、摄像头等)观测定位自身位置、姿态、运动轨迹,再根据自身位置进行增量式的地图构建,从而达到同时定位和地图构建的目的