北大AI公开课第四讲：吴甘沙无智能不驾驶

linxid

于 2017-06-17 18:26:49 发布

阅读量620

点赞数

分类专栏：人工智能文章标签：吴甘沙无人驾驶人工智能激光雷达

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linxid/article/details/73382238

版权

人工智能专栏收录该内容

38 篇文章 12 订阅

订阅专栏

主讲人：吴甘沙驭势科技创始人&CEO，智能驾驶，有多少个AI可以重来。

为什么要做智能驾驶：（经得起数次考验的问题值得去做）

城市中存在的一系列问题：交通事故，堵车，违规驾驶等问题。

三数据：停车难，96%的时间是停车的；35%的航程来找停车位；15%的土地是停车位。

存在的这些问题，导致了中国上下班浪费时间严重。限行等各种解决方案不能从根本上解决问题，系统的解决问题依靠无人驾驶。通过无人驾驶，未来私家车数量降低，出租车数量增加，出租车费用降低，出租车根据大数据分布。滴滴，峰值2100单/天，再增加，需要通过无人驾驶突破提供服务的车和人成本的局限。未来无人驾驶后，全国可达到5亿单/天。

时来天地皆同力，运去英雄不自由，大场面值得赌上20年，即使是现在起步依然不晚，后发优势，可以实现非线性加速。

无人驾驶离我们多远

无人驾驶三种技术：新司机（懂规则，感知和认知），认路的司机（地图和定位），老司机（决策）

感知和认知的理解：

激光雷达，几何世界的全面回忆，成本的降低是关键；替代方案：基于视觉、毫米波雷达和超声波等辅助传感器，像素世界的理解和预测。

案例：Tesla，1个单目摄像头（主要），12个超声波传感器（车周围），1个毫米波雷达，超声波传感器。

存在了缺陷：受到光照的影响，晨曦形成的强逆光；Detection by Recognition，与数据库中的障碍物相匹配，未能认出侧面，认出栅栏。

解决方案：1.重新通过摄像头构建一个几何世界。双目立体摄像头，可以用来识别动态和静态的障碍物。2.更好的计算机视觉，语音分割，视觉算法的角度（更好的分割方法，发现障碍物和可行驶区域的检测）。训练模型进行鲁棒，然后检测出大货车和普通车的区别。

第一：深度学习的不足，车辆识别率90%左右，自行车行人识别率70%多。解决办法：使用更多标注数据，获得更高准确率的模型。大量数据的标注方法：机器学习实现半自动标注，预训练，迁移学习，在线学习+自监督学习。

第二：嵌入式部署，需要考虑实时性、模型的大小和计算量。办法：图像压缩（down sampling，encoding），模型压缩，级联算法（region proposal）。

第三：多任务网络，检测人车、交通标志和车道线等；检测分类，语义分割一体。

认路的司机，地图和定位技术：

高精度定位系统（RTK），依靠多天线的差分计算，获得厘米级的定位，但是容易受到外接环境的影响。

视觉里程计（记录图像帧与帧之间的视觉特征点的位移），可以实现相对定位。

二维码：XJBD，通过二维码确定相对的举例和角度。

SLAM：同步的建图和定位。基于视觉的SLAM，结合高精地图的定位，可以做得更好。

未来机会：SLAM技术的鲁棒性，多传感器的融合，基于基础高精地图的地图学习和更新。

老司机，开的好、平稳，有社会性、竞争性：

判断态势，评估他方动机，预测行为。

监督学习：给一个状态，然后对它进行预测，而这个预测对外界环境不会由影响。

强化学习：需要与环境互动，包括马尔科夫决策过程，循环神经网络。

未来机会：

融合基于深度学习的车感和背景知识，基于迁移学习的举一反三，基于贝叶斯的逻辑/因果推理。

从动态的角度理解视频，而不是一些帧，从中推导运动状态，动机，因果关系。

预测学习：predictive learning，无监督学习的重要方法。

如何处理未知情况，开的万无一失：

关于虚拟世界，真实世界，是否是关键是任务的划分。

比代码更难的是数据以及上面的随机算法和机器学习。

案列：

谷歌，训练神经网络识别哑铃，出现的肉色胳膊的数据集。

谷歌，左右两幅图，像素级的差别，机器学习认不出来，引出对抗。

系统需要可预期的置信度，高置信度下的自动驾驶的可靠性，模拟仿真和强化学习，虚拟环境里不断训练。

基于模拟器的测试：成本低、灵活性高，基于大数据，可无限生成测试模型，可通过人工智能算法（eg强化学习）自动训练和测试无限里程。

深度学习，黑盒子，可解释性。对抗训练，生成性对抗网络。

穿越迷雾，从demo到deploy，

成功的次数：做demo，100次成功1次就可以。部署需要100次成功100次。

成本，拍demo可以用多个激光雷达，落地就需要考量成本因素。

从算法能力到系统能力，算法+鲁棒性+实时性+软硬件垂直整合。对需求和场景的理解。

对话环节：

1. 0-5级的无人驾驶系统，1级偶尔辅助，2级相当长时间可以驾驶，自动泊车，3级，驾驶员不需要关注驾驶，4级几乎无人驾驶，场景的限制。

2. 无人驾驶的实现速度，3年商业化，5年量产，场景控制，做出约束。

3. 5级的实现，人容易高估短期影响力，低估长期影响力。5级到底需不需要？？？？

4. 未来主导技术，传感器的空前丰富，360无死角，车联网，超视距。任何无人驾驶分车道。

5. 云和端的配合进行计算，无人驾驶，现在只在端上。云上便于知识的传播。

6. Intel收购，零部件的组合化，供应商的整合，从control到computing，软件硬件化，SDK，开放还是封闭的环境。

7. 专门定制芯片，而不是通用芯片，具有一定的可编程性，不能作死，保证日后一定得更新。

8. 未来发展方向，车厂具有一定话语权，制造利润降低，汽车厂和互联网公司联合。特定场景的无人驾驶汽车，景区园区等等。

9. 堵车情况下，各种手段的融合，来准确绝对定位，惯性导航。

10. 无人驾驶的安全性，黑客问题。边缘化创新，不选择主流的创新。寻找不同而不是更好，

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
北大AI公开课第四讲：吴甘沙无智能不驾驶

主讲人：吴甘沙驭势科技创始人&CEO，智能驾驶，有多少个AI可以重来。为什么要做智能驾驶：（经得起数次考验的问题值得去做）城市中存在的一系列问题：交通事故，堵车，违规驾驶等问题。三数据：停车难，96%的时间是停车的；35%的航程来找停车位；15%的土地是停车位。存在的这些问题，导致了中国上下班浪费时间严重。限行等各种解决方案不能从根本上解决问
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

linxid 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。