听说百度要放弃基础通用大模型的研发了，真的假的？

最新推荐文章于 2024-09-10 16:08:18 发布

公众号:肉眼品世界

最新推荐文章于 2024-09-10 16:08:18 发布

阅读量376

点赞数 8

文章标签：百度

本文链接：https://blog.csdn.net/weixin_45727359/article/details/142113324

版权

前言：百度一路BAT的样子，曾经 ALL IN AI，文心一言号称马上超越CHATGPT，如今听说要放弃基础大模型的研发了

阅读文本大概需要 2 分钟。

来自中科院大学理学硕士柯哀教主的回答：

作者：柯哀教主
链接：https://www.zhihu.com/question/665973671/answer/3613688108
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

不知道百度的情况，不敢妄自判断，不过对于大模型的现状，我大概有些不成熟的判断。

其一，国内大模型的主要资金在B端。

国内大模型C端基本以免费为主，主要的收入来源是面向企业的行业大模型。而行业大模型的本质是解决方案，企业引入大模型的驱动力是把企业内部数据转换为竞争力。因此，你得整明白企业数据。

国外知名AI公司Palantir（据说帮助美军抓获本拉登的），从2023年2月发布AIP（面向企业的AI平台），就是以他们的Ontology产品为基础的。他们CEO采访时说，没有数据基础的大模型就是self-pleasure，没有意义。Palantir采用了OAG（Ontology Augmented Generation，本体辅助生成），应用效果很好，商业用户接受度高，收入和利润表现极好。股价从2023年开始，到2024年2月（财年结束），涨了280%。因为Palantir是真的能把企业的数据整明白，且他们有大量的行业解决方案积累。

如果你光关注国外的OpenAI等知名C端大厂，就会忽视掉，国内企业要盈利，对标的正是像Palantir这样的公司。而国内哪家企业把自己的数据整明白了？哪家公司能帮客户把数据整明白了？数据血缘都搞不清，历（屎）史（山）深（堆）厚（积），数据部门人员众多，用起数来却无比痛苦。基本不可能做巨大改变，否则会动太多人利益。这样的状态，根本无法有效落地大模型，产生价值。

因此，后续要在大模型赚钱，肯定要服务大国企（普通企业没钱也没必要做这种面子工程），且需要本地部署（安全可控因素），且需要有行业解决方案和梳理数据，一个项目搞个小几百万，是个辛苦活，大公司看不上，因此主要是一些中小公司做这个。也不需要自研基础模型，多试几个开源的，微调一下，搞些工作流编排，满足业务即可。

因此，基础大模型厂商如果不做C端付费，有大基数的用户，其经济上不可持续。

其二，现在大模型的定位已经非常清晰，它是个效率（Productivity）提升技术，而不是个使能（Enabler）技术。

什么是效率提升技术？就是它能够让你做一件事更快、更用户友好，而不是把不可能变成可能。

比如图（知识图谱）是一个使能技术，比如你想发现欺诈团伙，如果不用图算法（社区划分），你搞不定。客户画像的社区属性你不用图也很难计算出来。Data Fabric的元数据不用知识图谱很难实现。

大模型呢？它是一个交互界面。固然它会有一定的知识，你可以理解为对训练数据的记忆+平均，它不是精确的。它可以给出一些自然的交互，识别人的意图，但是一旦用于严肃场景，就需要RAG等技术路线去增强（Grounding+Guardrail），本质真正做事的，是背后的Retrieval引擎，以及Agent调用的外部工具，大模型本身只是一个自然语言界面。

之前我以为大模型还能帮你写材料，但是它只能生成一些流水账式的文本。真正写材料，要突出关键点，这背后都是一些逻辑思考，而不是文本堆叠。因此，即便是大模型最擅长的文本任务，在严肃场合，用大模型也只会被领导或者客户叼，写得什么玩意儿。

所以现在Gartner提的是什么？复合AI（Composite AI），大模型（生成式的）和传统机器学习模型（决策型）、知识图谱等结合，组成满足用户需求的技术方案。

第三，大模型的技术路线真的能通向AGI吗？（大模型不可能具有像人类一样的精确又灵活的逻辑思维，代替人类去思考）

最近Wolfram又出精品文章了，推荐看看：

What’s Really Going On in Machine Learning? Some Minimal Models

基于他的研究，深度学习模型，其原理不可解释。它只是利用了“计算”的特征，它可以表面上看起来达成了某个目标，但是具体怎么达成的，有无数的路线，不一定是非要被人理解的那一条。因为计算的“空间”是非常庞大的。甚至可能每个模型实现对文本概率预测的方式完全不同，他们表面上实现的功能仍是相同的。

一个不可能跟人类可理解的逻辑相联系的方式，通过训练数据“暴力拟合”出来的结果，不大可能实现AGI。你能想象每个人智力的机制完全不同，却最终有同样的效果吗？

因此，大模型不可能从效率工具转变为使能工具，它的价值没有那么大。从这个意义上说，它是一个进步，它有一定的价值，但是没有彭博等机构预测的那么大的市场空间。这个泡沫早晚会破裂。

最后，回到百度，它没有面向企业服务的基因，大模型本身的价值不足以支撑C端的大量付费，它也联合了政府去“建造全国产化的大模型生态”，想靠行政影响力巩固下自己的市场，但是他们选择的生态合作伙伴一言难尽，同时作为互联网企业，也应该知道免费开源才是大杀器。

除了守住原有业务，百度下一步能做什么呢？它不像初创企业靠这几年讲讲故事，上市套现即可，它也不可能转型to B服务型公司，去做IT咨询和外包，它持续投入基础模型研发，又没有利润。确实蛮头疼的。

其实对于大模型，早有判断，《Didaproject创始人：大模型的真问题》，但为什么投资人和大厂都那么乐观呢，因为钱在手里，他们根本不承认自己的弱项，还打起鲜明的旗帜捶我这样的人，《腾讯发布新一代大模型：混元 Turbo，湖南居然有自研大模型团队》看看这个就更加知道谁更懂大模型产业了，为什么最懂的人还没钱?WHY?这个得问中国人民自己，问自己想不想变富，想不想自己的国家变强大？

如果想自己变富，自己的国家变强大，《完全想不到，嘀嗒文库上不仅又出现百度文库，还出现了网易文库》，这样类似的操作又是何种解释？

当然，昨天我还参加了长沙市的岳麓峰会，像百度这样的都摸不清大模型怎么应用，但是百度至少有点儿谱谱，那个AI的会场我没报希望，就没有去，直接去产业互联网想认识一些人，听一些见解，结果是各位领导流水线的介绍自己的产品或者平时总结的数据，数据倒是有用，但是更有用的是这些稍微能赚钱的产业互联网企业如何艰辛创业的，他的模式和痛点是什么，解决了什么问题，还缺哪些，国外的互联网这个方面为什么做得好？有哪些技术应用了？互联网的玩法如何实现增量用户和存量用户的留存？没有这些能叫互联网？当然人家毕竟从来和我没什么交集，唯一的交集就是偶尔参加参加他们的峰会，当然其实有个长沙的简总平时还不错，至少积极的办很多事儿，但是他办的那些事儿毕竟是离市场竞争的原则差很多的，面对岳麓峰会没有实际承认不足的，一起改进，而是搬出各种头头证明岳麓峰会办得好，办得好不好不是谁站牌出来就是好的，而是大家都会看见的，这是人民的心声，实事求是的好处就是经得起推敲，选出能带领大家一起致富的人，其他问题就越少，这个道理大家很清楚。各自有各自的专长，搞稳定的做好搞稳定，搞科技的做好搞科技，搞战略的做好搞战略，面对现实的世界竞争，以前那种搞不得，实事求是，让更多的人才涌现，让每个人都更富裕，为自己的国家自豪，有什么不好？

当然岳麓峰会也是地方为经济发展做出的努力，只是这个努力如果缺乏专业的方式，花了钱不一定有效果，这个是我们每个人值得思考的地方，到底怎么办，用什么样的人，往往是主管这个方面的头头的大脑而已

那中国经济要走向何方，如何走？百度，抖音，拼多多，小红书，知乎，其实你们可以回答一下，还有那些地方要员你们要回答一下，到底你们想不想一起变富，还是守着过往的思想和地盘与人民的进步事业做对抗，这个答案由自己选择，也由人民选择，人民的命运掌握在自己手里。

推荐阅读：
ChatGPT 4o 国内直接用 (新)！！！
世界的真实格局分析，地球人类社会底层运行原理
不是你需要中台，而是一名合格的架构师（附各大厂中台建设PPT）
长沙最大(中国领先)的创业俱乐部成立

腾讯XX集团数据湖项目建设方案(附下载)
论数字化转型——转什么，如何转？

华为干部与人才发展手册（附PPT）
【中台实践】华为大数据中台架构分享.pdf

华为的数字化转型方法论

华为如何实施数字化转型（附PPT）
华为大数据解决方案（PPT）

公众号:肉眼品世界

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
听说百度要放弃基础通用大模型的研发了，真的假的？

前言：百度一路BAT的样子，曾经 ALL IN AI，文心一言号称马上超越CHATGPT，如今听说要放弃基础大模型的研发了阅读文本大概需要 2 分钟。来自中科院大学理学硕士柯哀教主的回答：作者：柯哀教主链接：https://www.zhihu.com/question/665973671/answer/3613688108来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出...
复制链接

扫一扫