第一个是
**
薛建儒的“无人驾驶的深度学习方法探索与研究”
**
1,无人车的研究现状
2,视觉主导的场景理解
3,运动决策
4,端到端的感知运动
1
- 研究现状
16年的特斯拉—18的Uber—waymo(谷歌)
经历了辅助驾驶-自动驾驶–自主驾驶
无人驾驶就是经历一个感知到理解的过程,感知主要依赖于传感器,然后做一个结构化描述,这个结构化描述就是通过相机-激光-雷达的协同对于场景做一个不变性的表征,根据这个结构化的描述做一个度量,进行预测,进一步做出决策。
-
场景理解
分为静态场景理解和动态场景理解,静态场景理解主要完成的任务就是定位和导航,包括道路边界线,车道线。动态场景理解主要是安全驾驶,包括占据车道,运动轨迹,交通规则。
静态
之前采用的都是几何物理的方法,通过几何度量达到语义的推导与预测,度量是否是安全距离,是否遵守交通规则。也可以使用机器学习的方法进行检测。
静态的定位可以是有局部拼接组合成全局的来进行预测,主要有两个方法,分比别为用历史的观测进行预测和将所有的数据都放在一起进行预测。
引入了地图进行静态场景的预测、
1,使用深度网络的slam,预测位姿变化使用递归网络,图优化的方法
2在地图上加入运动规划,地图创建lstm,分层优化用CNN
3引入主动交互的强化学习,主要是初始位置和位置位置的获取,可以使用贝叶斯滤波加策略学习
动态
可以包括对于周边车辆的行为分析,(检测-追踪-识别这三个方面进行集成),融合3D激光点云的视觉障碍,在时间和空间上做对齐。用激光点云去除faster-rcnn的行人检测的虚警,点云在faster-rcnn做校验。
分层架构
1,行为决策(是超车,还是换道)
2,运动规划,(运动轨迹,从初始状态到目标状态,是在一定的约束条件下比如最大速度)
3,运动控制,使车沿着期望的路径行驶 -
运动决策
策略学习就是,最优的路径是什么,道路光滑程度,形状
结构化的场景到非结构的场景,行为决策加路径规划联合学习
- 感知运动划分很多环节(类人技术)
构建敏捷灵巧的记忆与注意力网络,从记忆到推理然后学习,需要结合强化学习和深度学习。
深度学习的稀疏性和稠密行的探讨
一个已经训练好的网络具有一定的稀疏性。
-
sparce activity
-
stacking
就是反复利用上几层的结果作为新的模型的输入,
gan网络的堆叠做阴影的检测,包括阴影的detection and removal -
dense topology
deep residual network
densenet,层与层之间的全连接
stacking net。密集的拓扑结构
resnet,表面是跨层,其实是全联接,依赖所有层的输出结果。
resnet是取并,densenet是加
总结
1,深度网络的拓扑结构应该是密集的,多层连接代表无限可能
2随着训练,网络结构是稀疏的,可以节能高效的处理任务。
这些与人脑的成长是类似的,