主讲人:吴甘沙 驭势科技创始人&CEO,智能驾驶,有多少个AI可以重来。
为什么要做智能驾驶:(经得起数次考验的问题值得去做)
城市中存在的一系列问题:交通事故,堵车,违规驾驶等问题。
三数据:停车难,96%的时间是停车的;35%的航程来找停车位;15%的土地是停车位。
存在的这些问题,导致了中国上下班浪费时间严重。限行等各种解决方案不能从根本上解决问题,系统的解决问题依靠无人驾驶。通过无人驾驶,未来私家车数量降低,出租车数量增加,出租车费用降低,出租车根据大数据分布。滴滴,峰值2100单/天,再增加,需要通过无人驾驶突破提供服务的车和人成本的局限。未来无人驾驶后,全国可达到5亿单/天。
时来天地皆同力,运去英雄不自由,大场面值得赌上20年,即使是现在起步依然不晚,后发优势,可以实现非线性加速。
无人驾驶离我们多远
无人驾驶三种技术:新司机(懂规则,感知和认知),认路的司机(地图和定位),老司机(决策)
- 感知和认知的理解:
激光雷达,几何世界的全面回忆,成本的降低是关键;替代方案:基于视觉、毫米波雷达和超声波等辅助传感器,像素世界的理解和预测。
案例:Tesla,1个单目摄像头(主要),12个超声波传感器(车周围),1个毫米波雷达,超声波传感器。
存在了缺陷:受到光照的影响,晨曦形成的强逆光;Detection by Recognition,与数据库中的障碍物相匹配,未能认出侧面,认出栅栏。
解决方案:1.重新通过摄像头构建一个几何世界。双目立体摄像头,可以用来识别动态和静态的障碍物。2.更好的计算机视觉,语音分割,视觉算法的角度(更好的分割方法,发现障碍物和可行驶区域的检测)。训练模型进行鲁棒,然后检测出大货车和普通车的区别。
第一:深度学习的不足,车辆识别率90%左右,自行车行人识别率70%多。解决办法:使用更多标注数据,获得更高准确率的模型。大量数据的标注方法:机器学习实现半自动标注,预训练,迁移学习,在线学习+自监督学习。
第二:嵌入式部署,需要考虑实时性、模型的大小和计算量。办法:图像压缩(down sampling,encoding),模型压缩,级联算法(region proposal)。
第三:多任务网络,检测人车、交通标志和车道线等;检测分类,语义分割一体。
认路的司机,地图和定位技术:
高精度定位系统(RTK),依靠多天线的差分计算,获得厘米级的定位,但是容易受到外接环境的影响。
视觉里程计(记录图像帧与帧之间的视觉特征点的位移),可以实现相对定位。
二维码:XJBD,通过二维码确定相对的举例和角度。
SLAM:同步的建图和定位。基于视觉的SLAM,结合高精地图的定位,可以做得更好。
未来机会:SLAM技术的鲁棒性,多传感器的融合,基于基础高精地图的地图学习和更新。
老司机,开的好、平稳,有社会性、竞争性:
判断态势,评估他方动机,预测行为。
监督学习:给一个状态,然后对它进行预测,而这个预测对外界环境不会由影响。
强化学习:需要与环境互动,包括马尔科夫决策过程,循环神经网络。
未来机会:
融合基于深度学习的车感和背景知识,基于迁移学习的举一反三,基于贝叶斯的逻辑/因果推理。
从动态的角度理解视频,而不是一些帧,从中推导运动状态,动机,因果关系。
预测学习:predictive learning,无监督学习的重要方法。
如何处理未知情况,开的万无一失:
关于虚拟世界,真实世界,是否是关键是任务的划分。
比代码更难的是数据以及上面的随机算法和机器学习。
案列:
谷歌,训练神经网络识别哑铃,出现的肉色胳膊的数据集。
谷歌,左右两幅图,像素级的差别,机器学习认不出来,引出对抗。
系统需要可预期的置信度,高置信度下的自动驾驶的可靠性,模拟仿真和强化学习,虚拟环境里不断训练。
基于模拟器的测试:成本低、灵活性高,基于大数据,可无限生成测试模型,可通过人工智能算法(eg强化学习)自动训练和测试无限里程。
深度学习,黑盒子,可解释性。对抗训练,生成性对抗网络。
穿越迷雾,从demo到deploy,
成功的次数:做demo,100次成功1次就可以。部署需要100次成功100次。
成本,拍demo可以用多个激光雷达,落地就需要考量成本因素。
从算法能力到系统能力,算法+鲁棒性+实时性+软硬件垂直整合。对需求和场景的理解。
对话环节:
1. 0-5级的无人驾驶系统,1级偶尔辅助,2级相当长时间可以驾驶,自动泊车,3级,驾驶员不需要关注驾驶,4级几乎无人驾驶,场景的限制。
2. 无人驾驶的实现速度,3年商业化,5年量产,场景控制,做出约束。
3. 5级的实现,人容易高估短期影响力,低估长期影响力。5级到底需不需要????
4. 未来主导技术,传感器的空前丰富,360无死角,车联网,超视距。任何无人驾驶分车道。
5. 云和端的配合进行计算,无人驾驶,现在只在端上。云上便于知识的传播。
6. Intel收购,零部件的组合化,供应商的整合,从control到computing,软件硬件化,SDK,开放还是封闭的环境。
7. 专门定制芯片,而不是通用芯片,具有一定的可编程性,不能作死,保证日后一定得更新。
8. 未来发展方向,车厂具有一定话语权,制造利润降低,汽车厂和互联网公司联合。特定场景的无人驾驶汽车,景区园区等等。
9. 堵车情况下,各种手段的融合,来准确绝对定位,惯性导航。
10. 无人驾驶的安全性,黑客问题。边缘化创新,不选择主流的创新。寻找不同而不是更好,