【揭秘多模态】多模态大模型，驶向AGI时代的核心推动力

AD AutoDrive

已于 2024-08-19 17:58:25 修改

阅读量1.1k

点赞数 23

文章标签：语音识别人工智能

于 2024-08-19 10:27:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Evelynnzhao/article/details/141316929

版权

|什么是模态？

随着越来越多的大模型上车，创新的汽车智能化产品和服务不断涌现。当你发现一个好用或者好玩的功能，想要分享给朋友时，可以用文字写出来，可以给对方发语音，也可以拍照分享，当然拍一个功能完整演示的视频也属于常规操作。

无论是文本、语音、图像还是视频，都是我们表达和传递信息、同时也是感知信息的方式，而每一种信息的来源或者形式，可以称之为「模态」（Modality）。一个有意思的功能是信息，表现形式或者说媒介是多种多样的，也就是说，同一个信息，模态可以是多元的。

人类通过视觉、听觉、触觉、嗅觉等感官来接收和理解外部的信息，也可以通过前述的文字、语音、图像、视频等模态来表达、传递和交流信息。不过只是将模态划分到这些媒介并不足够细，更广义上来说，两种不同的语言，比如中文和英文，也是两种不同的模态。

世界上万事万物都有不同的表现形式，形形色色的模态让我们生活的环境丰富多彩，人类认识、理解乃至改造环境，离不开多种模态信息的交互。

|为什么大模型需要多模态？

在人工智能的发展过程中，此前大多数模型主要是基于单一模态的数据进行学习、训练和推理的。

最低0.47元/天解锁文章

博客等级

码龄4年

15
原创

373
点赞

320
收藏

284
粉丝

关注

私信

热门文章

分类专栏

AI 7篇
大模型 4篇
智能驾驶 1篇
自动驾驶 1篇
芯片 2篇

最新评论

「百万级」仿真场景库积累，为智驾研发「降本增效」
CSDN-Ada助手: 恭喜作者第11篇博客的成功发布！看到您关于“百万级”仿真场景库的积累，为智驾研发带来的“降本增效”的探讨，让人不禁感叹您对于这一领域的深入思考和努力。在未来的创作中，或许可以考虑从实际案例出发，分享一些成功应用仿真场景库的案例，或者深入探讨智驾技术在实际道路中的应用挑战与解决方案。期待您的更多精彩内容！
OccNet 栅格占据网络：重建智能驾驶场景表征
CSDN-Ada助手: 恭喜您撰写了第7篇博客，探讨了OccNet 栅格占据网络在重建智能驾驶场景表征方面的应用。您对这一主题的深入探讨展现了您对领域的独到见解和扎实的研究能力，希望您能继续保持创作的热情和动力。在下一步的创作中，建议您可以尝试拓展研究范围，比如探讨OccNet在其他领域的应用，或者深入分析其在智能驾驶中的优势和不足之处。同时，也可以考虑加入一些实例或案例分析，让读者更直观地了解您的观点和研究成果。期待您更多精彩的文章，加油！
从 UniAD 到智驾 AGI，解读智驾新趋势（2023.09）
CSDN-Ada助手: 恭喜您撰写了第八篇博客，标题为“从 UniAD 到智驾 AGI，解读智驾新趋势（2023.09）”。您对智驾新趋势的解读令人耳目一新，让人深感启发。希望您能继续保持创作的热情和耐心，探索更多有关智驾领域的内容。或许在下一篇博客中，可以分享一些关于未来智驾技术的发展前景，或者是对于智能驾驶在不同行业中的应用案例进行深入分析。期待您的精彩内容！
BEV 目标感知能力：效果稳定，目标丰富
CSDN-Ada助手: 恭喜用户第5篇博客发布！标题“BEV 目标感知能力：效果稳定，目标丰富”听起来非常吸引人！希望您能继续保持创作的热情和稳定的效果，同时也建议您在下一篇博客中可以探讨一下目标感知能力的应用场景，或者分享一些案例分析，让读者更深入地了解这一主题。期待您更多的精彩内容！
数据闭环转动，决策规划算法驶入「快车道」
CSDN-Ada助手: 恭喜您在博客领域的不懈努力，第6篇文章的标题看起来让人感到振奋！数据闭环转动，决策规划算法驶入「快车道」，听起来充满了前进的动力和潜力。希望您能继续保持创作的热情和耐心，不断探索和分享更多有价值的内容。或许在下一篇博客中，可以深入探讨一些实际案例，或者分享一些行业内的最新趋势和发展，这样能够为读者提供更多的启发与思考。期待您的下一篇作品！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。