听说百度要放弃基础通用大模型的研发了,真的假的?

前言:百度一路BAT的样子,曾经 ALL IN AI,文心一言号称马上超越CHATGPT,如今听说要放弃基础大模型的研发了

阅读文本大概需要 2 分钟。

0ed157d5c1b724d770675536887bc2d9.jpeg

57f499418f83e831833ed246780bb2d5.jpeg

来自中科院大学 理学硕士柯哀教主的回答:

作者:柯哀教主
链接:https://www.zhihu.com/question/665973671/answer/3613688108
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

不知道百度的情况,不敢妄自判断,不过对于大模型的现状,我大概有些不成熟的判断。

其一,国内大模型的主要资金在B端。

国内大模型C端基本以免费为主,主要的收入来源是面向企业的行业大模型。而行业大模型的本质是解决方案,企业引入大模型的驱动力是把企业内部数据转换为竞争力。因此,你得整明白企业数据。

国外知名AI公司Palantir(据说帮助美军抓获本拉登的),从2023年2月发布AIP(面向企业的AI平台),就是以他们的Ontology产品为基础的。他们CEO采访时说,没有数据基础的大模型就是self-pleasure,没有意义。Palantir采用了OAG(Ontology Augmented Generation,本体辅助生成),应用效果很好,商业用户接受度高,收入和利润表现极好。股价从2023年开始,到2024年2月(财年结束),涨了280%。因为Palantir是真的能把企业的数据整明白,且他们有大量的行业解决方案积累。

如果你光关注国外的OpenAI等知名C端大厂,就会忽视掉,国内企业要盈利,对标的正是像Palantir这样的公司。而国内哪家企业把自己的数据整明白了?哪家公司能帮客户把数据整明白了?数据血缘都搞不清,历(屎)史(山)深(堆)厚(积),数据部门人员众多,用起数来却无比痛苦。基本不可能做巨大改变,否则会动太多人利益。这样的状态,根本无法有效落地大模型,产生价值。

因此,后续要在大模型赚钱,肯定要服务大国企(普通企业没钱也没必要做这种面子工程),且需要本地部署(安全可控因素),且需要有行业解决方案和梳理数据,一个项目搞个小几百万,是个辛苦活,大公司看不上,因此主要是一些中小公司做这个。也不需要自研基础模型,多试几个开源的,微调一下,搞些工作流编排,满足业务即可。

因此,基础大模型厂商如果不做C端付费,有大基数的用户,其经济上不可持续。

其二,现在大模型的定位已经非常清晰,它是个效率(Productivity)提升技术,而不是个使能(Enabler)技术。

什么是效率提升技术?就是它能够让你做一件事更快、更用户友好,而不是把不可能变成可能。

比如图(知识图谱)是一个使能技术,比如你想发现欺诈团伙,如果不用图算法(社区划分),你搞不定。客户画像的社区属性你不用图也很难计算出来。Data Fabric的元数据不用知识图谱很难实现。

大模型呢?它是一个交互界面。固然它会有一定的知识,你可以理解为对训练数据的记忆+平均,它不是精确的。它可以给出一些自然的交互,识别人的意图,但是一旦用于严肃场景,就需要RAG等技术路线去增强(Grounding+Guardrail),本质真正做事的,是背后的Retrieval引擎,以及Agent调用的外部工具,大模型本身只是一个自然语言界面。

之前我以为大模型还能帮你写材料,但是它只能生成一些流水账式的文本。真正写材料,要突出关键点,这背后都是一些逻辑思考,而不是文本堆叠。因此,即便是大模型最擅长的文本任务,在严肃场合,用大模型也只会被领导或者客户叼,写得什么玩意儿。

所以现在Gartner提的是什么?复合AI(Composite AI),大模型(生成式的)和传统机器学习模型(决策型)、知识图谱等结合,组成满足用户需求的技术方案。

第三,大模型的技术路线真的能通向AGI吗?(大模型不可能具有像人类一样的精确又灵活的逻辑思维,代替人类去思考)

最近Wolfram又出精品文章了,推荐看看:

What’s Really Going On in Machine Learning? Some Minimal Models

基于他的研究,深度学习模型,其原理不可解释。它只是利用了“计算”的特征,它可以表面上看起来达成了某个目标,但是具体怎么达成的,有无数的路线,不一定是非要被人理解的那一条。因为计算的“空间”是非常庞大的。甚至可能每个模型实现对文本概率预测的方式完全不同,他们表面上实现的功能仍是相同的。

一个不可能跟人类可理解的逻辑相联系的方式,通过训练数据“暴力拟合”出来的结果,不大可能实现AGI。你能想象每个人智力的机制完全不同,却最终有同样的效果吗?

因此,大模型不可能从效率工具转变为使能工具,它的价值没有那么大。从这个意义上说,它是一个进步,它有一定的价值,但是没有彭博等机构预测的那么大的市场空间。这个泡沫早晚会破裂。

最后,回到百度,它没有面向企业服务的基因,大模型本身的价值不足以支撑C端的大量付费,它也联合了政府去“建造全国产化的大模型生态”,想靠行政影响力巩固下自己的市场,但是他们选择的生态合作伙伴一言难尽,同时作为互联网企业,也应该知道免费开源才是大杀器。

除了守住原有业务,百度下一步能做什么呢?它不像初创企业靠这几年讲讲故事,上市套现即可,它也不可能转型to B服务型公司,去做IT咨询和外包,它持续投入基础模型研发,又没有利润。确实蛮头疼的。

7e016523afc7f08b50bad57ff2250c84.jpeg

其实对于大模型,早有判断,《Didaproject创始人:大模型的真问题》,但为什么投资人和大厂都那么乐观呢,因为钱在手里,他们根本不承认自己的弱项,还打起鲜明的旗帜捶我这样的人,《腾讯发布新一代大模型:混元 Turbo,湖南居然有自研大模型团队》看看这个就更加知道谁更懂大模型产业了,为什么最懂的人还没钱?WHY?这个得问中国人民自己,问自己想不想变富,想不想自己的国家变强大?

如果想自己变富,自己的国家变强大,《完全想不到,嘀嗒文库上不仅又出现百度文库,还出现了网易文库》,这样类似的操作又是何种解释?

当然,昨天我还参加了长沙市的岳麓峰会,像百度这样的都摸不清大模型怎么应用,但是百度至少有点儿谱谱,那个AI的会场我没报希望,就没有去,直接去产业互联网想认识一些人,听一些见解,结果是各位领导流水线的介绍自己的产品或者平时总结的数据,数据倒是有用,但是更有用的是这些稍微能赚钱的产业互联网企业如何艰辛创业的,他的模式和痛点是什么,解决了什么问题,还缺哪些,国外的互联网这个方面为什么做得好?有哪些技术应用了?互联网的玩法如何实现增量用户和存量用户的留存?没有这些能叫互联网?当然人家毕竟从来和我没什么交集,唯一的交集就是偶尔参加参加他们的峰会,当然其实有个长沙的简总平时还不错,至少积极的办很多事儿,但是他办的那些事儿毕竟是离市场竞争的原则差很多的,面对岳麓峰会没有实际承认不足的,一起改进,而是搬出各种头头证明岳麓峰会办得好,办得好不好不是谁站牌出来就是好的,而是大家都会看见的,这是人民的心声,实事求是的好处就是经得起推敲,选出能带领大家一起致富的人,其他问题就越少,这个道理大家很清楚。各自有各自的专长,搞稳定的做好搞稳定,搞科技的做好搞科技,搞战略的做好搞战略,面对现实的世界竞争,以前那种搞不得,实事求是,让更多的人才涌现,让每个人都更富裕,为自己的国家自豪,有什么不好?

当然岳麓峰会也是地方为经济发展做出的努力,只是这个努力如果缺乏专业的方式,花了钱不一定有效果,这个是我们每个人值得思考的地方,到底怎么办,用什么样的人,往往是主管这个方面的头头的大脑而已

那中国经济要走向何方,如何走?百度,抖音,拼多多,小红书,知乎,其实你们可以回答一下,还有那些地方要员你们要回答一下,到底你们想不想一起变富,还是守着过往的思想和地盘与人民的进步事业做对抗,这个答案由自己选择,也由人民选择,人民的命运掌握在自己手里。

推荐阅读:
ChatGPT 4o 国内直接用 (新)!!!
世界的真实格局分析,地球人类社会底层运行原理
不是你需要中台,而是一名合格的架构师(附各大厂中台建设PPT)
长沙最大(中国领先)的创业俱乐部成立

腾讯XX集团数据湖项目建设方案(附下载)
论数字化转型——转什么,如何转?

华为干部与人才发展手册(附PPT)
【中台实践】华为大数据中台架构分享.pdf

华为的数字化转型方法论

华为如何实施数字化转型(附PPT)
华为大数据解决方案(PPT)
  • 8
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值