城市自动驾驶:技术挑战与未来展望
一年前,华为发布会宣称城市NCA会在年底推送,但截止至元旦仍未推送,所以在24年1月份,舆论是不利于华为的。
春节前一周,华为开始造势大规模推送无图城市NCA,舆论有反转趋势,作为理性吃瓜的业内人士,有必要抛开眼花缭乱的流量纷争,尽可能客观聊一聊何谓无图、何谓城市领航辅助(城市NOA)。
附赠自动驾驶最全的学习资料和量产经验:链接
一 城市自动驾驶正在乱局
在说无图城市NOA之前,有必要先看下当前的局势。
按进度来看,华为和小鹏是这场乱局的主角。蔚来、理想、大疆、ME、momenta等相对因为产品的侧重点或者战略路线不同在进度上可以排到下个级别。
华为在推送了城市NCA之后,开城进度“遥遥领先”,72.8万城,即其宣称中国道路的百分之九十九以上都是其可通行道路,或者说没了开城这个概念,直接哪儿都通。
在2023年中下旬,其L2功能的边界已经足够扩大,可以处理各种小视频里的乡间小路,非结构化车道、路口等。这是其他家暂不具备的能力,为后续推送城市NCA打下了坚实的基础。
小鹏的技术方案相对笨重一点,开城的概念是由小鹏提出的,其每个城市都要投入数十个人,花费按月计的时间。开城主要工作量在于修图和测试。
其观点是没有一个简明统一的方法,可以处理所有工况,所有城市,所以需要一事一议,为每个可能的特殊场景做特殊处理。
从工程测试这个角度说,开城这个概念还是比较对消费者负责的。小鹏整个开城进度也是比较快的,224城。从功能体验上来讲,小鹏做的相对会保守一些,但这种保守会导致驾驶体验并不是很好。
这里先抛出一个问题:为啥无图还要修图?后面会给出解答。
理想相对进度慢一点,年前定下的100城宣言也并没有全量推送,现阶段只有4座高精度地图覆盖的城市。从李想的各种发声来看,理想自动驾驶的技术思路还不够清晰,但理想的智驾部门已经疯狂扩张了一年,真让人看不懂。
蔚来、Mobileye、大疆等还未做出城市NOA功能的推送,但在发布会上都或多或少的提到了城市NOA功能的推送计划以及技术方案。
当前这个时间点,正是宣传多年的城市自动驾驶,从期货变为现货的紧要关头。
神秘盖头即将揭开:
它到底是一个弥天大骗局,还是真的颠覆性的突破。
各家到底是在画饼吹牛,还是有真家伙。
城市自动驾驶如果实现,将拥有巨大的商业价值。因为普通汽车消费者的大部分使用场景,都不是高速和城快,当前自动驾驶使用中,功能频繁的退出会将一段路程分割的支离破碎,这是当前自动驾驶技术在消费者端得不到认可的瓶颈所在。
如果华为率先解决了这个问题,做出来了更好的差异化的用户体验,那所有车企都将被卷入这个战场。
落后者的技术方案面临推倒清零;新势力的时尚标签也将重新洗牌。
二 城市场景难解决的问题在哪儿
城市NOA如此重要,厂商们营销力度如此之大,却总是跳票,这说明了城市场景相比高速场景,难度上有数量级的差距。
那到底哪来的难度呢。
1 感知类
1.1道路拓扑关系、导流带
高速场景下,只有二分叉一种情况。
但城市场景下,三分叉是常见的,五角场之类的地方四分叉五分叉也是有可能的。
二分叉时,只用选择左右道线去跟踪就可以了。多分叉时,则要识别出每一条线,每一个导流带,且要和地图做定位配准。
目前小鹏还是重地图方案,这种方案的问题除了地图成本不可控,鲜度不满足要求外,最大的问题在于对高精定位的依赖,而由于城市中,卫星信号易受高楼立交天桥等遮挡,高精定位并不能特别可靠。
1.2 停止线/特殊停止线/人行横道等路面标识
城市中地标的语义更加丰富,且每个城市都有特殊的地标,如北京的公交车道标识就有只工作日有效和每日有效两种。
这部分的工作量是高速场景的100倍左右。
1.3 非标的路沿、非标障碍物。
高速只需识别出一种语义,而城市要识别出无数种语义。这对视觉的泛化能力要求有本质的不同。使用激光雷达可以大幅降低难度,这也是华为等国内厂商的技术路线,同tesla的纯视觉方案相区别。
由于激光雷达的成本在令人惊异的快速下降,国内厂商的技术路线可能成为最终标准。
华为在这一项上目前在领先地位。
1.4 信号灯、异性信号灯,长得像信号灯的非信号灯
红绿灯的识别,初看上去很简单。但它的工作量,会超出业外人士的想象。
小鹏的红绿灯识别,经常会将匝道内的通行指示灯、指示慢速通行的灯误识别为红绿灯,导致误刹车。
但是,小鹏的红绿灯识别,是目前已发布的产品里做的最好的。
1.5 施工区域等
目前高速场景的施工区域都没有得到较好的解决,城市场景更加复杂。
目前华为小鹏都还未能解决。
众包方法是可行方案之一。
2 决策类
2.1 交规对决策产生影响
例如:潮汐车道、公交车道对换道逻辑,学校、路口对加减速逻辑,限时禁止左转路口,限时调头路口对路口路径规划的逻辑等。
2.2 摩托车电动车等不确定性预测设
想你开车时,四面八方有飞驰的外卖小哥,而且你惊恐的发现他们在低头看手机,甚至一只手划手机。他们自己都无法预测自己。
不要指望有任何预测算法可以生效。老老实实做好感知是正道。
2.3 对称博弈场景
如两个车静止在一个出口,如果都启动会相撞,如果都精止会僵持下去,那谁先启动呢。类似的还有,3车道时左车道右车道都向中车道并线;环岛两车并行时一车想出一车想入,轨迹交叉。
2.4 潜在语义
假设街上空无一人一车,同样的道路(比如总共2车道的直路),道路外是沙漠还是一排大门紧闭的便利店,人会做出不同的车速和路径选择。但机器感知现在不能感知到沙漠和便利店这些信息。
还比如,道路外是一面墙,墙有个豁口,人类会判断鬼探头的风险。这个判断也很不简单,比如一个4米宽的豁口和1米宽的豁口,哪个鬼探头的风险更大呢,人类会觉得后者大;幼儿园的墙和监狱的墙,又哪个鬼探头的风险更大呢。
可我们现在的感知连豁口的识别能力都没有。
总之,决策规划遇到的挑战可能远超过感知。
上面的难点可能会耦合在一起,同时驾驶的行为千奇百怪,像一个老司机一样和周围的交通参与者与潜在的参与者交互,完成加塞、被加塞、换道、掉头等,是一个艰巨的挑战。
3 安全感
城市场景,和高速场景的区别,人开车时也会深有体会,感觉好像高速上开车可以走神,脑子可以放松,会犯困。
所以,高速场景,驾驶员即使明知道系统有小概率的误报漏报,也不会太紧张。因为人发现不对劲后,有秒级的安全接管时间。
城市场景,则完全不同,各种电动车和密集行人,人开车时都会全神贯注心惊胆颤,机器误判后留给人的反应时间只有百毫秒级。
要做到减轻驾驶员精神负担,城市自动驾驶对可用可靠和安全的需求有数个数量级的提升。
三 这些问题现在被解决了吗
城市自动驾驶的目标是:
1事故率足够低(低于人类驾驶),
2接管率足够低。但是现在的城市NOA远达不到这种水平。
即使按照华为自己发布的小视频,在无高精地图的场景下,道路拓扑不清晰只有路沿的情况、VRU、路口接管还是比较多的。并且和人、和车的交互还是非常保守。
小鹏,相比华为功能表现弱不少,难以独自完成掉头、左转等行为,其他小问题是数不胜数,产品成熟度还做不到Bosch安波福等上一世代的玩家的水准。城市自动驾驶,还任重道远。
对于后续玩家来说,做出来差异化体验是有很大可能的。
最后值得一提的是,国内这些厂商要想做好城市自动驾驶,除了在上面这些领域有所突破,做加法外,还需要做减法,去掉目前技术方案中不合理的部分。
华为小鹏等的当前产品,传统的感知性能是做的相当不错(对于车/人/道线等的Object Detection),不输于传统国外供应商。但是,在最后的功能细节表现上,也就是规控部分的工程化上,做的还不够细致。
工程上的弯路,大多是被不接地气的理论带歪的,总是能走回来的。
我们下一期接着谈:
什么是无图?
为什么无图也要修图?
什么是众包?
众包是否仅限于地图?
如何解决安全需求?
最可能的技术方案是什么样的?
它的成本能下探到多少万的车型?