点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
前言
谈纯视觉,绕不过的就是特斯拉。先说第⼀点:纯视觉这这条路真的⾮常难⾛。「纯视觉这条路不好⾛」参考特斯拉。也是在不断地找⽅法,让其纯视觉算法变得更好。
编辑 | 自动驾驶之心 作者丨JamesYang@知乎
链接丨https://www.zhihu.com/answer/2716531531
纯视觉之路不好⾛
能⼒上限:逼近L3
纯视觉领域的其他玩家Mobileye
前景&⼀点⼩建议
谈纯视觉,绕不过的就是特斯拉。
先说第⼀点:纯视觉这这条路真的⾮常难⾛。
「纯视觉这条路不好⾛」
参考特斯拉。也是在不断地找⽅法,让其纯视觉算法变得更好。
去年特斯拉AI Day 上,特斯拉着重强调了⾃⼰的BEV ⽹络(更多⽤于静态物体的识别)。

但是今年,特斯拉基本上没有太多去提BEV 相关内容,⽽是⼜新推出占⽤神经⽹络(the occupancy network),直接通过摄像头来构建真实世界三维模型。

同时,增加了对动态物体以及运动状态可能发⽣变化的物体的识别,⽐如这个公交:



此外,特斯拉还准备引⼊更多新的神经⽹络,⽐如NeRF((Neural Radiance Fields) 神经辐射场,提升重建三维场景的能⼒。

举特斯拉的例⼦其实是为了说明:「纯视觉这条路并没有那么好⾛,技术路线可能随时会发⽣调整。」
就好像现在BEV ⽹络被占⽤⽹络替代⼀样,后续很有可能还会被新的⽹络模型所替代。
「纯视觉⽅案能⼒上限:逼近L3」
特斯拉FSD 基本上代表了纯视觉的最⾼⽔平,这⼀点⼤家不否认吧。
⽽从能⼒实现层⾯,在海外,就说美国本⼟吧,「现在特斯拉FSD Beta 能⼒已经⽆限逼近L3。」
不管是城市、⾼速,亦或者是没有⻋道线的乡村⼟路,特斯拉FSD 都能去开上⼀开。
特斯拉的⽜逼之处就在于使⽤普通的导航地图,就能实现类似⾼精地图的能⼒。
不过,特斯拉⽬前在两⽅⾯去继续钻研:「能⼒和体验。」
「能力」
能⼒层⾯,⾏⻋「这⼀块差不多实现七七⼋⼋」,仍在啃⼀些⻓尾场景的硬⻣头,⽐如说这种路边随处停着的⼀台⻋,⽆法分辨这台⻋的状态(动态or 静态):

「在拿掉超声波传感器之后,特斯拉纯视觉正式向泊⻋域开进」,将会解决此前此前特斯拉泊⻋⽅⾯的问题(⽐如⽆法识别空⻋位、泊⻋识别率和泊⼊成功率等)。
「体验」
体验层⾯,特斯拉引⼊打分机制,提升FSD 使⽤舒适度:

「纯视觉领域的玩家」
其实,不仅仅是特斯拉,还有好⼏个玩家都在纯视觉领域摸索。
⽐如Mobileye。这位也是纯视觉领域的⼤拿。
EyeQ 系列芯⽚在⾏业⾥出货量很多,很⼤⼚商都在采⽤EyeQ 芯⽚来提供视觉感知,⽐如早期的特斯拉、蔚来、理想,都和Mobileye 有很深的合作。
接下来说Mobileye 在纯视觉领域的进展。
Mobileye 开发了两套⾃动驾驶系统:纯视觉:摄像头⼦系统Mobileye SuperVision™和雷达/ 激光雷达⼦系统,两台系统独⽴运⾏,互为补充。
不同于特斯拉,Mobileye 会⽤到众包⾼精地图。
摄像头⼦系统Mobileye SuperVision™,也就是纯视觉这套,已经在国内新实⼒⻋企极氪上量产,能⼒差不多是L2+ 的样⼦:

但是由于没能解决地图问题,很多能⼒⽐如领航辅助都⽆法解锁。
今年9⽉,Mobileye 宣布与吉利控股集团进⼀步扩⼤业务合作:极氪还将在两款新⻋型上搭载Mobileye SuperVision™,并与Mobileye 共同开发基于激光雷达的新功能。
基于环视视觉打造的系统预计将于今年年底通过OTA 更新实现全部功能释放。

虽然国内Mobileye SuperVision™能⼒看着很差,但它真正的实⼒不容⼩觑(要不然吉利也不会扩⼤和它的合作)。
和特斯拉⼀样,Mobileye SuperVision™也要看它在海外的能⼒。今年8⽉,Mobileye 完成了为期数天的洲际公路之旅,对其下⼀代Mobileye SuperVision™开展了测试,基于现有REM™ 的⾼精地图,⽤4 天⾏驶近2000 公⾥,穿越南欧和中欧6 国。
「翻译⼀下就是,Mobyeye 这套纯视觉解决⽅案适⽤性⾮常强,只要有REM 众包地图,不管是在哪个国家或者地区,都能很快应⽤起来。」
⽬前,关于下⼀代Mobileye SuperVision™,我们能够得到的信息是:
1、采⽤两块EyeQ®6HEyeQ®6H 芯⽚(⽬前极氪⽤的那套还是EyeQ5芯⽚);
2、能⼒⽅⾯,可实现可脱⼿/ 眼睛需注视的L2++ 系统。

「纯视觉路线的前景」
还是那句话,我们不知道⾃动驾驶的最终哪条路能⾛通。我们分为三种情况来看:
1、只有纯视觉这条路⾛得通
2、纯视觉和激光雷达路线都可以⾛通
3、只有激光雷达路线⾛得通
「1、只有纯视觉这条路⾛得通」
但是如果只有这条路真的⾛通了,那么特斯拉⼜将成为开创者。
就像现在她在电动⻋领域创造的辉煌⼀样,作为头⽺,可以吃到最⼤最多的红利。
⽽且,纯视觉路线成本很低,毕竟摄像头也没多少钱。随着⻋辆⼤规模交付,规模效应之下,成本会更低。
也不⽤说那么远,现在特斯拉拿掉毫⽶波雷达和超声波传感器,根据⻋拆解团队Munro Live 公开的分析报告显示,「这样操作特斯拉平均每辆⻋节省114 美元,约合⼈⺠币817 元。」
这都是实打实的好处。
「2、纯视觉和激光雷达路线都可以⾛通」
这就很意思了。
如果激光雷达路线也能跑通,但是各项成本算下来,似乎纯视觉成本还是要更便宜⼀点……

「3、只有激光雷达路线⾛得通」
如果到这个时候,我想各种传感器价格应该被打下来了。
如果真到这个时候,激光雷达和毫⽶波雷达⼀样便宜,我想特斯拉也⼀样会⽤。
虽然特斯拉⼀直专精在纯视觉,但是特斯拉也在研究各种可能性,⽐如4D 毫⽶波雷达等等。
所以,即便是调转研究⽅向,那么,特斯拉依然能够⾮常快的调整过来,并占据领先优势。
所以,最后,提⼀个建议,虽然激光雷达、4Dh 毫⽶波雷达的出现和应⽤,⼤幅度提升了⾃动驾驶感知能⼒,但是「我还是希望各家⻋企能够始终重视计算机视觉感知的研发,毕竟,任何传感器都⽆法替代摄像头的作⽤,同时也能在未来自动驾驶技术竞争中,取得领先地位。」
今天的讲解就到这⾥,散会。
下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。
下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。
下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~