自动驾驶---基于视觉语言模型的自动驾驶

智能汽车人

于 2025-04-27 07:30:00 发布

阅读量724

点赞数 17

分类专栏：自动驾驶感知&&端到端文章标签：自动驾驶语言模型人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/janeiskangs/article/details/144720885

版权

自动驾驶感知&&端到端专栏收录该内容

25 篇文章 ¥59.90 ¥99.00

订阅专栏

1 前言

在之前的博客中，多次提到理想汽车以及小米汽车都在使用VLM模型，在理想汽车中VLM大模型作为慢系统去思考复杂场景下车辆的行为；而在小米汽车中主要用于识别复杂场景并进行提示，两者在使用上还是有区别的。

理想汽车：《自动驾驶---各大车企的端到端之旅》

小米汽车（内容节选官方微博）：本次更新正式接入 VLM 视觉语言大模型，系统可识别复杂道路环境和特殊交通规则区域，并通过文字和语音提示。

那么本篇博客就深入介绍VLM大模型在自动驾驶上的应用，后续会继续针对车企发表的论文进行阐述。

2 VLM视觉语言大模型

本篇博客结合量产实际情况以及相关论文进行说明，不当之处，欢迎交流。其实早在2024年2月份的时候ÿ

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

智能汽车人 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。