1 前言
在之前的博客中,多次提到理想汽车以及小米汽车都在使用VLM模型,在理想汽车中VLM大模型作为慢系统去思考复杂场景下车辆的行为;而在小米汽车中主要用于识别复杂场景并进行提示,两者在使用上还是有区别的。
理想汽车:《自动驾驶---各大车企的端到端之旅》
小米汽车(内容节选官方微博):本次更新正式接入 VLM 视觉语言大模型,系统可识别复杂道路环境和特殊交通规则区域,并通过文字和语音提示。
那么本篇博客就深入介绍VLM大模型在自动驾驶上的应用,后续会继续针对车企发表的论文进行阐述。
2 VLM视觉语言大模型
本篇博客结合量产实际情况以及相关论文进行说明,不当之处,欢迎交流。其实早在2024年2月份的时候ÿ