张量命名争议后续:大模型极限竞速下的疲态初显

自从ChatGPT发布以来,大模型领域竞争激烈,涉及模型参数、团队竞争、开源态度及技术创新。张量命名事件尘埃落定,焦点转向模型项目对开源的回馈与底层创新。众多团队在资源囤积和技术突破中寻找市场先机,但底层技术创新的需求仍被强调。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

8d4b6c0e99284069c843753317f181ab.gif

作者 | ygg    

出品 | CSDN(ID:CSDNnews)

大模型的赛场自去年 11 月底 ChatGPT 发布后,就没有空闲过一天。

大模型冰山之上是模型参数与效果的比较、团队阵容排兵的竞争,冰山之下,是融资步伐的你追我赶、算力储备的筹谋划分、资源山头的阵营盘算。

由零一万物 Yi 大模型引发的争议,在不同的舆论场往不同的方向持续分叉。将一潭本就复杂的大模型池水,又搅动得风起云涌。

d5ccd5e6a076bdb0e355ed5c54d81ccf.png

张量命名修改已结案 开源态度有待观察

该事件在模型技术圈的讨论,以贾扬清朋友圈里不具名的揭短开启,「复用 LLaMA 架构,改变开源代码名字、替换几个变量名」引发了各个模型专家对「修改模型张量名命名是否不当」的讨论。

最新情况是 Hugging Face 机器学习工程师 Arthur Zucker ,在昨夜回复「Transformers 的代码本身并不受 Llama 许可证约束」,Yi 大模型的发布是被 Hugging Face 接受的。

5350fb0e622d108ba218553a86addd31.png

Hugging Face 工程师最新官方回应

零一万物修改模型张量名称命名这场风波,基本已经看到结论。绝大多数从业者冷静之后,也趋于赞同「修改张量名称命名,会给后续适配 Llama 生态带来些许困难,但本身并没有商业道德问题,更不存在换壳、盗版的情况。」

更深入的争议,则是在基于开源土壤成长起来的大模型项目,是否应该更加开放、积极的姿态回馈开源,这个问题的答案也是肯定的,毕竟零一万物已经表态了「01.AI 起步受益于开源,也贡献开源,从社区中虚心学习,我们会持续进步。」

415264d03ca79cc67cc2428831603a84.png

大模型竞速现状:快屯粮、慢磨枪

全社会都眼看着大量资金与精英人才投入大模型赛道,创始人们在中、美、中东飞来飞去,为未来12-18个月囤积财力与算力。每个明星团队在推出新模型时,不断提高声量,不断屠榜对标,但鲜少有团队明确将以模型底层技术的自主创新作为目标。

网传近日李彦宏在西丽湖论坛上,提及「国内 200 多个大模型其实都没什么使用量」,这也是国内数百个模型团队鱼龙混杂的现实情况,但并不影响各大企业前仆后继进入大模型赛道,抢占位置和资源。

因为根据互联网 1.0 和 2.0 时代总结下来的成功经验,技术突破和模式创新固然重要,但都是可以靠时间追赶。最重要的是尽快获得市场上的资金和信心,不然也许下一秒就会进入一个新的寒冬。

c4ce8bc80a96091455780b011c9b806b.png外媒前日发表文章分析中国 AI 企业融资现状

根据 IT 桔子数据显示,2023 年上半年国内人工智能领域共发生了 1066 起融资事件,涉及 3062 亿元人民币的融资金额。同期大洋彼岸也是类似的阵势,根据 Crunchbase 数据库,2023 年上半年全球人工智能领域共发生了 1842 起融资事件,涉及 545 亿美元的融资金额。

在人工智能领域中的资源投入,也扶持了一批头部企业打开了局面,不断加强机构的信心。

目前 OpenAI 已经完成了 103 亿美元的融资,估值达到 270 亿 -290 亿美元。国内除了智谱 AI 累计融资超 20 亿人民币,估值突破百亿人民币以外。Minimax、百川智能、月之暗面等第一梯队也会陆续接力迈过 20 亿美金估值门槛。

每天都有大模型的融资、发布、技术突破的新闻刷遍头条,也将全社会的期待推至顶峰。在这么多双眼睛的注视下,任何模型团队,都逃不过各环节被放大和审视的可能性。

4961ec7edaedc9188a7b9bd029c2e786.png

热切关注的本质是期待底层技术创新

大模型技术的发展,带来了大量 AI 应用创新的机会,让全社会为之一振。但同时白热化的资源竞争、类似的技术演进路线,也带来了肉眼可见的负面影响。

大炼模型,直接捅出了国内算力供给不平衡的真实现状。算得出来的存量 N 卡,溢价流通在微信群和朋友圈。其他品牌闲置吃灰,成为各地数据中心里的默认硬装,一度成为行业里茶余饭后的谈笑。

这也解释了为什么小小「模型张量的命名问题」,也会出圈到大众视野中。行业外的读者们密切关注和评论这条技术圈新闻,更多是再一次被「套壳」这类字眼,伤害了民众感情。

在大模型上的急切、疯狂的投入之下,我们也关心:头部的模型团队追赶 OpenAI 的同时,是否也应该引领和推动更深层次的创新?

此次风波,技术圈的关注点在于「张量命名行为的合理性」,而民众充分讨论的关注点在于「何时反超,何时领先」,但最核心仍然是当前大模型的发展资源还未向底层技术创新倾斜。

民众关心的底层技术创新,不是每日头条中的「重磅发布」、「比肩 OpenAI」,更不是「解释与声明」。而是在尊重常识、尊重科学技术、尊重开源的前提下,探索人类与机器智能的无限可能。

推荐阅读:

▶最“倒霉”的果粉:在苹果官网买的 iPhone 15 PM,变成了高仿 Android 手机!

大模型会毁了年轻程序员 —— 对话图灵奖得主 Joseph Sifakis | 新程序员

▶李开复再度回应争议:取之开源也贡献开源;OpenAI 暂停 ChatGPT Plus 新用户注册;微软官宣两款自研芯片|极客头条

b333d982c540b92beef76be02f369528.jpeg

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CSDN资讯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值