AI大模型技术路线之争：你可以信仰多模态，也可以无视多模态

最新推荐文章于 2024-07-15 20:58:17 发布

亲爱的数据

最新推荐文章于 2024-07-15 20:58:17 发布

阅读量857

点赞数 10

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39640818/article/details/137063523

版权

亲爱的数据：谭婧

（一）观点争锋

大模型的故事里，或许会有句话：

技术路线错误意味着死亡，

在错误的道路上，

跑越快，死越快。

如果你不信，我们一起算笔账，

头部大模型公司，每月算力支出是多少？

如果没有数据中心的话，

每月千万人民币级别算力支出。

不能说得再细了。

竞争到了这个阶段，犯大错意味着什么？

选择技术路线，就是选择生或死。

这些性命攸关的系统性选择，不止做一次，

选不选，什么时候选，选哪种。

反正OpenAI（OAI）已给出了自己的答案。

开始的开始，是由大语言模型拉开大幕，GPT-3.5属于超大规模语言模型。

而随后的GPT-4时刻，

OAI在官网技术博客上透露：

“GPT-4的一个重大提升是开始涉及多模态”。

并且，他们释放了图文部分的“下集预告”。

时过半年，GPT-4Vision它来了，

此前预告，顺手实现。

GPT-4的情况基本可以确定，

而GPT-4Vision没有放出模型结构和论文，

不能武断，但至少可以保守地说做了图和文。

看看名字，都带着Vision。

回顾一笔，多模态大模型在国内从来都不是“稀有物种”。

早在GPT-3.5发布之前，国内早期大模型探索者也是有人选纯语言，有人选多模态，相当于两条技术路线都占了。

选择纯语言技术路线的是华为诺亚方舟实验室的盘古，选择多模态技术路线的是阿里巴巴达摩院和清华唐杰教授团队，紫东太初团队。

只是，早期效果都不好，谁也别笑话谁。

但可以说，中国团队征服多模态的雄心壮志自始有之，无奈效果一般。

回到当下，虽然全球范围语言大模型占多数，

开源社区更是繁茂，

但多模态仍不是“稀有物种”。

例如，国外大团队的作品，GPT-4、Gemini 1.5等；

国外小团队的作品，Fuyu系列，LLaVA系列。

（《2023年终盘点：图文大模型编年简史》-可点击阅读）

Claude 3更是明确说明和早期版本不同，

是多模态，能够理解文本和照片输入。

就好像某位诺贝尔文

最低0.47元/天解锁文章

亲爱的数据

关注

10
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
AI大模型技术路线之争：你可以信仰多模态，也可以无视多模态

亲爱的数据：谭婧（一）观点争锋大模型的故事里，或许会有句话：技术路线错误意味着死亡，在错误的道路上，跑越快，死越快。如果你不信，我们一起算笔账，头部大模型公司，每月算力支出是多少？如果没有数据中心的话，每月千万人民币级别算力支出。不能说得再细了。竞争到了这个阶段，犯大错意味着什么？选择技术路线，就是选择生或死。这些性命攸关的系统性选择，不止做一次，选不选，什么时候选，选哪种。反正OpenAI（OA...
复制链接

扫一扫

亲爱的数据 CSDN认证博客专家 CSDN认证企业博客

码龄7年

185: 原创

17万+: 周排名

1万+: 总排名

13万+: 访问

: 等级

1693: 积分

306: 粉丝

350: 获赞

17: 评论

381: 收藏

私信

关注

热门文章

最新评论

云从科技从容大模型：大模型和AI平台什么关系？为什么造行业大模型？
CSDN-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 上传ChatGPT/计算机论文等资源，瓜分￥5000元现金: https://blog.csdn.net/VIP_Assistant/article/details/130196121?utm_source=csdn_ai_ada_redpacket 新人首创任务挑战赛: https://marketing.csdn.net/p/90a06697f3eae83aabea1e150f5be8a5?utm_source=csdn_ai_ada_redpacket Microsoft Edge功能测评！: https://activity.csdn.net/creatActivity?id=10403?utm_source=csdn_ai_ada_redpacket 职场解惑讨论会: https://activity.csdn.net/creatActivity?id=10427?utm_source=csdn_ai_ada_redpacket 可持续能源技术真的能改变世界吗？: https://activity.csdn.net/creatActivity?id=10425?utm_source=csdn_ai_ada_redpacket 无效数据，你会怎么处理？: https://activity.csdn.net/creatActivity?id=10423?utm_source=csdn_ai_ada_redpacket 物联网技术正在如何影响我们的生活: https://activity.csdn.net/creatActivity?id=10421?utm_source=csdn_ai_ada_redpacket 生物识别技术能否成为应对安全挑战的绝佳选择？: https://activity.csdn.net/creatActivity?id=10411?utm_source=csdn_ai_ada_redpacket 应届生如何提高职场竞争力: https://activity.csdn.net/creatActivity?id=10409?utm_source=csdn_ai_ada_redpacket 讯飞星火大模型将超越chatgpt？: https://activity.csdn.net/creatActivity?id=10407?utm_source=csdn_ai_ada_redpacket 职场新人备忘录: https://activity.csdn.net/creatActivity?id=10405?utm_source=csdn_ai_ada_redpacket “裸奔”时代下该如何保护网络隐私: https://activity.csdn.net/creatActivity?id=10401?utm_source=csdn_ai_ada_redpacket VR vs AR：哪种技术更有潜力改变未来？: https://activity.csdn.net/creatActivity?id=10399?utm_source=csdn_ai_ada_redpacket 蓝桥杯备赛指南分享: https://activity.csdn.net/creatActivity?id=10317?utm_source=csdn_ai_ada_redpacket
独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow，光年之外欲添新大将...
samRsa: 本文作者照片好漂漂
独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow，光年之外欲添新大将...
赵4老师: 本文作者照片好漂漂
清华系创企RealAI：独家“隐私保护机器学习”技术，全球首款编译级产品
普通网友: 收获很多，谢谢大佬的分享，要是能得到大佬的点赞必是极好的
清华系创企RealAI：独家“隐私保护机器学习”技术，全球首款编译级产品
普通网友: 学起来，头秃的那种~

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。