自主驾驶小车运输设备视觉部分

关键词:自主驾驶小车视觉;形状信息;目标检测;姿态估计;场景重建;躲避障碍

摘要:基于深度相机的方法是指利用深度相机(如Microsoft Kinect、Intel RealSense等)获取场景中物体的三维空间位置和形状信息,并通过分析这些信息实现目标检测、姿态估计、场景重建等任务的方法。小车的躲避障碍问题主要体现在多人流的情况下,设计一种能让小车从起始点安全抵达目标并且回到起始点的方法,并且要确保物品在运输过程中不会有损耗,拥有高效的避障能力已经成为自主驾驶小车完成任务的安全保障之一。基于单目视觉的方法是一种只利用单个摄像机的图像信息来实现深度感知、目标检测和姿态估计等任务的方法。

[Keywords]: autonomous driving car vision;shape information;object detection; pose estimation, scene reconstruction;obstacle avoidance.

[Abstract]: The method based on depth cameras refers to the use of depth cameras (such as Microsoft Kinect, Intel RealSense, etc.) to obtain three-dimensional spatial position and shape information of objects in the scene, and to achieve tasks such as object detection, pose estimation, and scene reconstruction by analyzing this information. The obstacle avoidance problem of small cars is mainly reflected in the situation of multiple people flow. Designing a method that can safely reach the target and return to the starting point of the car, and ensuring that items are not damaged during transportation, with efficient obstacle avoidance ability has become one of the safety guarantees for autonomous driving of small cars to complete tasks. The method based on monocular vision is a method that utilizes only the image information of a single camera to achieve tasks such as depth perception, object detection, and pose estimation.

1、引言:

        随着自主驾驶技术的不断发展,自主驾驶的可靠性和安全性逐渐提高。自主驾驶小车运输设备依靠着安全性、效率性和准确性、节约成本、环境友好、适应性和可扩展性的这些优势具有广阔的应用前景。目前自主驾驶技术体现在社会服务方面主要体现在配送物品方面,提高人民的生活质量。但在实践中存在面对技术、法律、道德和安全等方面的挑战。同时,对于地铁、大街、学校里环境复杂多变,自主驾驶小车在处理任务时会遇到更多的突发情况,在处理未知障碍上的问题显著。

        小车的躲避障碍问题主要体现在多人流的情况下,设计一种能让小车从起始点安全抵达目标并且回到起始点的方法,并且要确保物品在运输过程中不会有损耗,拥有高效的避障能力已经成为自主驾驶小车完成任务的安全保障之一。

        目前已经存在很多针对躲避障碍问题的参考文献在不同的角度上提出解决方案,本文将对小车躲避系统视觉部分研究进行综述。

2、视觉部分介绍

        视觉是自主驾驶系统中的重要感知模块之一。自动驾驶车辆通过搭载各类视觉传感器(如摄像头)来获取道路和周围环境的图像信息。这些图像信息经过图像处理和计算机视觉算法的处理后,可以提取出道路、车辆、行人、交通标志、交通灯等各种目标物体的位置和特征。这样的感知信息可以用于实现车辆定位、目标检测、目标跟踪、行为分析等功能。 

        自主驾驶系统可以使用计算机视觉算法对所获取的图像信息进行分析和理解,从而实现对路况和交通参与者的感知能力。这为自动驾驶车辆的决策和控制提供了重要的输入。基于视觉感知的信息,自主驾驶系统可以生成路径规划并做出相应的行驶决策,如加减速、转弯、超行人等。

3、避障视觉方法研究

        关于小车避障方法的研究,根据其研究成果不同判定方法大体可分为六大类共十九种方法

                1. 基于图像处理的方法
                   - 深度学习方法
                   - 光流估计方法
                   - 特征提取与匹配方法
                   - 弱纹理方法
                   - 语义分割方法
                   - 实例分割方法
                   - 目标检测与跟踪方法
                   - 全景视觉方法

                2. 基于深度信息的方法
                   - 立体视觉方法
                   - 单目视觉方法
                   - 深度相机方法

                3. 基于传感器融合的方法
                   - 激光雷达与摄像头融合方法

                4. 基于传感器的方法
                   - 红外传感器方法
                   - 超声波传感器方法

                5. 基于机器学习的方法
                   - 强化学习方法
                   - 非监督学习方法

                6. 其他方法
                   - 稀疏重建方法
                   - 稳定性分析与优化方法

       需要注意的是,自主驾驶小车的方法研究分类没有统一界定,在实际运行时也可以按照需求将这十九种方法结合或其他算法结合使用,让小车更加完美的完成执行任务。本文将提十种主要方法的分类思路。

1. 深度学习方法

        基于深度学习的避障机器人视觉导航方法是一种利用神经网络进行图像识别和分割的方法,用于预测和定位图像中的障碍物。文献[1]提出使用神经网络进行图像识别和分割,可以预测和定位图像中的障碍物。

2. 光流估计方法
        基于光流估计的方法是一种利用连续帧图像间的像素位移来推测物体运动的方法。 光流是由物体表面的纹理、摄像机运动和深度信息等因素共同决定的。文献[2]通过计算连续帧之间像素的运动信息,可以判断物体的运动轨迹,并检测是否有障碍物。

3. 特征提取与匹配方法
        基于特征提取与匹配的方法是一种常用的计算机视觉方法,用于在图像中提取特定的特征点,并通过匹配这些特征点来实现目标检测、目标跟踪、定位和导航等任务。文献[3]通过提取图像中的局部特征及其匹配,可以实现对障碍物的检测和识别。

4. 立体视觉方法
        基于立体视觉的方法是一种利用多个视角的图像信息来实现深度感知和三维重建的方法。该方法基于两个或多个摄像机的视角差异,通过对图像进行匹配和几何计算来推断物体的深度和形状。文献[4]利用立体视觉技术获取场景的3D深度信息,计算物体距离以判断是否存在障碍物,并作出避障决策。

5. 单目视觉方法
        基于单目视觉的方法是一种只利用单个摄像机的图像信息来实现深度感知、目标检测和姿态估计等任务的方法。文献[5]利用单个摄像头获取图像信息,通过图像处理和分析实现障碍物的检测和避免。

6. 激光雷达与摄像头融合方法
        基于激光雷达和摄像头的融合方法是利用激光雷达和摄像头两种传感器的信息进行协同处理,从而提高目标检测、地图构建、姿态估计等任务的精度和鲁棒性。文献[6]将激光雷达和摄像头的数据进行融合,利用激光雷达提供的精确距离和摄像头提供的图像信息进行避障。

7. 红外传感器方法
        基于红外传感器的方法是指利用红外传感器获取的红外辐射信息来实现目标检测、跟踪、姿态估计等任务的方法。文献[7]利用红外传感器检测物体的热辐射及其反射,实现避障功能。

8. 超声波传感器方法
        基于超声波传感器的方法是指利用超声波传感器获取与目标物体之间的距离和反射信息,从而实现目标检测、障碍物避障、定位等任务的方法。文献[8]利用超声波传感器测量物体与传感器之间的距离,判断是否存在障碍物。

9. 深度相机方法
        基于深度相机的方法是指利用深度相机(如Microsoft Kinect、Intel RealSense等)获取场景中物体的三维空间位置和形状信息,并通过分析这些信息实现目标检测、姿态估计、场景重建等任务的方法。文献[9]利用深度相机(如微软的Kinect)获取场景的深度图像,实现对障碍物的检测和避免。

10. 弱文理方法
        基于弱纹理的方法是指在场景中纹理信息较弱的情况下,通过利用其他特征或方法来实现目标检测、跟踪、定位等任务的方法。文献[10]通过在图像中检测和分析弱文理特征,实现对障碍物的检测和识别。

参考文献

[1]王晓辉, 廖靖波, 顾永明等. (2012). 基于深度学习的避障机器人视觉导航方法. 机器人

[2]Horn, B.K.P., & Schunck, B.G. (1981). Determining Optical Flow. Artificial Intelligence, 17(1-3), 185-203.

[3]Lowe, D.G. (2004). Distinctive Image Features from Scale-Invariant Keypoints. International Journal of Computer Vision, 60(2), 91-110.

[4]Scharstein, D., & Szeliski, R. (2002). A Taxonomy and Evaluation of Dense Two-Frame Stereo Correspondence Algorithms. International Journal of Computer Vision, 47(1-3), 7-42.

[5]Mnih, V., Kavukcuoglu, K., Silver, D., et al. (2015). Human-level Control through Deep Reinforcement Learning. Nature, 518(7540), 529-533.

[6]王雨蒙, 朱传耀, 马林等. (2013). 基于激光和视觉融合的机器人导航算法. 国防科技大学学报.

[7]曾彬, 纪霜霜, 吕京金等. (2011). 机器人避障技术中红外传感器的应用. 安徽农业科学.

[8]王波, 乔智, 张庆华等. (2014). 基于超声波传感器的机器人避障方法. 自动化仪表.

[9]Zhang, Z. (2012). Microsoft Kinect Sensor and Its Effect. IEEE Multimedia, 13(4), 48-59.

[10]Felzenszwalb, P.F., Girshick, R.B., McAllester, D., & Ramanan, D. (2010). Object Detection with Discriminatively Trained Part-Based Models. IEEE Transactions on Pattern Analysis and Machine Intelligence, 32(9), 1627-1645.

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值