无人驾驶实践入门——感知
计算机视觉:
最常用CNN卷积神经网络
四个核心任务:
检测
分类
跟踪
语义分割
图像分类器:
捕获图像—>预处理—>提取特征—>分类
为了完成这些步骤,需要建立模型
摄像头图像:
最常见的计算机视觉数据
图像是一个二维矩阵,矩阵中为像素值
大多数彩色图像可由红黄蓝三种图像组成,即RGB图像含有三层图像深度
LiDAR图像:
使用激光创建环境点云图像
通过激光脉冲反射时间测量距离
点云数据可以告诉形状、纹理信息等,可用于聚类分析、对象检测、跟踪等。
机器学习
训练学习结果并保存到称为“模型”的数据结构中。
应用场景:
金融机构用来预测股票、证券交易数据
零售企业用来预测需求
医生用来辅助医疗诊断
分类:
监督学习,标记数据
无监督学习,无标记数据
半监督学习,少量标记数据
强化学习,使用多种模型训练数据,提供奖励机制