1. 感知简介
感知系统中使用了大量的计算机视觉的技术。对于目标识别目标检测来说,目前工业界用的比较多的是CNN,也就是卷积神经网络(Convolutional Neural Network)。
2. Sebastian 介绍感知
略
3. 计算机视觉
计算机不能像人类那样理解图像,图像在计算机的世界里只是一堆数值。
无人驾驶中的感知任务主要有四个:检测、分类、跟踪和语义分割。
- 检测是指找出物体在环境中的位置;分类是指明确对象是什么;
- 分类是指明确对象是什么;
- 跟踪是指随时间的推移观察移动的物体(例如其他车辆、自行车和行人);
- 语义分割是指将图像中的每个像素与语义类别进行匹配(如道路、汽车或天空)。
我们可以将分类作为研究计算机视觉一般流程的例子。图像分类器是一种将图像作为输入并输出标识改图像的”标签"或者“类别"的算法。
例如,交通标志分类器查看停车标志并识别它是停车标志、让路标志、限速标志还是其他类型的标志。
分类器甚至可以识别行为,比如一个人是在走路还是跑步。
分类器有很多种,但它们都包含一系列类似的步骤。
- 首先,计算机接受摄像头等成像设备的输入,这通常被捕获为图像或一系列图像。
- 然后通过预处理发送每个图像,预处理对每个图像进行了标准化处理,常见的预处理步骤包括调整图像大小或旋转图像,或将图像从一个色彩空间转化为另一个色彩空间,例如从全彩转化为灰度。预处理可以帮助我们的模型更快的处理和学习图像。
- 接下来就是提取特征。
- 最后,这些特征被输入到分类模型中,通过图像特征来选择类别,输出结果。
4. 摄像头图像
在计算机的世界里,图像就是数值矩阵。对于图像的处理,说白了就是对于矩阵的处理。(可见数学的重要性呀!
这是一个二维的灰度图像示例:
对于彩色图像,可以看成是一个深度为3的二维色层的叠加:
5. LiDAR 图像
感知扩展到传感器,而不仅仅是摄像头,激光雷达传感器创建环境的点云表征,提供了难以通过摄像头提供的图像信息(例如距离和高度)。
下图是一个典型的激光雷达点云图像:激光雷达通过发射光脉冲来检测汽车周围的环境。蓝色点表示反射激光脉冲的物体,中间的黑色部分则是无人车本身占据的空间。
这些点云可以告诉我们关于物体的很多信息,例如其形状和表面纹理。通过对点进行聚类和分析,这些数据提供了足够的对象检测、跟踪和分类信息。下图是一个典型的在点云上的检测和分类结果:红色的代表行人,绿色的代表其他车辆。
6. 机器学习
机器学习可以分成下面几种类别:
- 监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。
监督学习和非监督学习的差别就是训练集目标是否人标注。他们都有训练集 且都有输入和输出
- 无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有生成对抗网络(GAN)、聚类。
- 半监督学习介于监督学习与无监督学习之间。
- 增强学习机器为了达成目标,随着环境的变动,而逐步调整其行为,并评估每一个行动之后所到的回馈是正向的或负向的。
具体的机器学习算法有:
构造间隔理论分布:聚类分析和模式识别
人工神经网络
决策树
感知器
支持向量机
集成学习AdaBoost
降维与度量学习
聚类
贝叶斯分类器
构造条件概率:回归分析和统计分类
高斯过程回归
线性判别分析
最近邻居法
径向基函数核
通过再生模型构造概率密度函数:
最大期望算法
概率图模型:包括贝叶斯网和Markov随机场
Generative Topographic Mapping
近似推断技术:
马尔可夫链
蒙特卡罗方法
变分法
最优化:大多数以上方法,直接或者间接使用最优化算法。