万字长文实录：360创始人周鸿祎讲企业如何拥抱AI-CSDN博客

版权声明：

文章内容和PPT来自网络公开资料，包括微信公众号“360公司”等。版权内容归原作者周鸿祎所有，本平台本文只做公开转载发表。

介绍

4月8日，360 集团创始人周鸿祎免费课AI系列课程第二讲，直播 3 个小时 25 分钟，干货满满。全网唯一无损版，建议收藏学习！

一、企业拥抱AI，就要建立AI认知，建立AI信仰

企业如何拥抱AI，还是先有个前提，就是要建立AI认知。
说白了很简单，就是你认不认同AI这件事。所以我总结了一个“AI信仰”。我觉得对于新东西，对AI，
我们还是要建立一个基本的认知和信仰，要不然我们的前提就不存在了。
我总结了6句话，大家可以自我验证一下。

1 、相不相信大模型是真智能

扪心自问，你是不是相信大模型是真智能？这个行业里有真AI专家、假AI专家，有时候拿试金石也能验

出来。比如Sora刚出来时候很惊艳，大家都看了Sora做的视频吗？有句话I cannot create what I
don’t understand。我不能理解的，我就不能创造，不能创造他没有⻅过的东西。但是有一些假AI专
家就为了哗众取宠，贬低说Sora就是个产品，Sora很简单。这么简单，怎么这么⻓时间我也没⻅谁做
出来一个。所以围绕着Sora和GPT的争论，到今天都还有。它到底是不是真智能？每次我在用大模型
的时候，我越用越有一种敬畏心理，虽然我努力说服自己，这玩意儿就是个机器，但是你在给它输不
同的词汇的时候，它确实反应是不一样的。所以相不相信大模型是真智能？我觉得这是认知的基础。

2 、相不相信AGI正在加速到来

AGI就是通用人工智能，相不相信它正在来到？有一次我口误被逮住了，我说差距还有一年，我后来改

口改成两三年，现在⻢斯克说三五年。但是你要知道OpenAI这批人之所以能够搞？为什么领先全世
界，在美国也是遥遥领先一枝独秀？为什么能把Google发明但自己没怎么认真用的Transformer模型
用到极致？所有的方法论都不再讲了，最重要的是他们有一个信仰，他们坚定地相信，只要我加数
据、加算力、加模型尺寸、加模型参数、加模型乘数，我一定能得到AGI。

包括现在自动驾驶，这两天大家知道⻢斯克在美国发了FSD的新版本，然后特斯拉的自动驾驶有了很大
的提升。可以告诉大家一个秘密，前两年的自动驾驶全是用规则来写规则，你写 1 万条规则，你的⻋都
会碰到第一万零一条你没遇⻅过的情况。所以现在世界流行的自动驾驶都在拿Transformer做训练，他
们所谓叫“端到端”，就是一个黑话，就是全部用数据来训练，他们就相信只要数据足够多，给的场
景足够丰富，机器自然会产生智能，自然会产生判断。所以OpenAI这批人，他们最近跟微软要花 1000
亿美金搞一个更大的超级计算中心，实际上就是他们坚信AGI一定会来。最近人工智能每天都有新成
果，这种度日如年的进展，所以你要相信AGI正在加速来到。人工智能如果不能达到AGI，那就认为人
工智能很多工作还是做不了。如果能达到AGI，就意味着它在相当程度上可以跟人的智能和能力相匹
敌。

3 、相不相信大模型是一场工业革命

尽管每个技术出来都说自己是革命，比如VR、WEB3、比特币、区块链，每个人都号称自己要掀起一
场革命，但是事实证明很多东西有的是技术创新，有的是产品体验创新，有的是商业模式创新。只有
大模型是一场真正的工业革命。

4 、相不相信大模型将重塑所有产品和业务

最近美国的VC轮着出各种报告，木头姐、红杉、A46Z，你看，在美国VC心目中，他们把这已经看成了
是 1995 年的互联网， 1982 年的个人电脑。所以工业革命意味着什么？就是大模型将重塑所有的产品和
业务。

5 、相不相信不拥抱AI的公司会被淘汰

为什么今天我选择来做AI的科普？因为 AI已经不是一个科技话题，AI今天是一个社会话题。
上至各国的领导人，下至企业里、工厂里打螺丝的工人，大家可能都关心说人工智能这玩意出来了，
对我们每个人到底有什么样的影响？因为我们看到的科幻小说太多了，看到科幻电影也比较多，所以
我觉得对我们企业家来讲，你的业务是不是值得用AI重做一遍，或者用AI加持一遍？那关于AI是不是会
带来大规模失业问题，我一直是持一个比较乐观的态度，但是我认为不用AI的公司会被用AI的公司淘
汰。虽然我们的业务今天不用AI什么事都没有，但你只要闭上眼睛想一想，如果你的对手、你的同
行、你的友商用AI降本增效了，比如说别人都用文生图来做海报、做宣传物料，用自动抠图一下提升
了很多的生产力，你的对手 200 个工程师全都用上这个大模型辅助编程代码，正确率提高了 2 0%，那你
会怎么想？

6 、相不相信不拥抱AI的员工会被淘汰

我一直坚信大模型对于每个人来讲，是人类有史以来发明的最好的一个生产力工具，可以提升我们个
人的能力。所以一般情况下我认为有了大模型并不意味着你会失业，因为你提高了工作效率，甚至解
锁了你很多过去不具备的能力。
比如说我们每个人都有很多创意，但是你未必能画出美好的图画，你未必能拍出很好的视频，甚至最

近有个Suno可以让你作曲，你给个歌词，它能给你作出一首听起来还蛮像样的歌。昨天晚上我还在跟
央视几个视频编辑在谈，有没有可能通过对字幕来进行剪辑，就是我把哪个字幕的字剪掉了，这一段
对应的视频就自动去掉了。我把哪一段话在文本编辑器里从后面提到中间，视频就自动跟着变了。如
果是这样的话，每个会编辑、会用word的人就都会剪辑视频了，那是不是能提高大家的工作效率？所
以那些不拥抱AI的员工会被淘汰。

二、2024年AI产业发展的十六个趋势

在⻛⻢牛那个晚会上，后来因为出了场闹剧，大家注意力都被转移了。大家都在讨论我面对这个挑衅
如何镇定应对，那个真不算。我的看家本事是在前面花了 40 分钟做了场脱口秀，讲AI发展的 10 个趋
势。⻛⻢牛讲完不到两个月，我数了一下，它有六七个、七八个趋势都已经初步被验证。然后有人问
我说往后怎么办呢？所以我又加了 6 个趋势，大家可以仔细看一下。

一、开源大模型爆发，大模型未来将无处不在
二、未来大国间AGI竞争的关键是“云端超级大模型”，规模越做越大
三、大模型同时越做越小，搭载于智能终端
四、企业级大模型市场崛起，企业会同时拥有多个垂直大模型
五、多模态成为大模型的关键能力
六、文生图、文生视频等AIGC功能突破性增⻓
七、ToC继续涌现杀手级应用
八、知识工程成为大模型落地的决定性要素
九、AIAgent激发大模型潜能成为超级生产力工具
十、人形机器人产业发展获得十倍加速
十一、大模型认知能力不断提升，自动驾驶迎来革命性变化
十二、大模型帮助生物科学等基础科学研究突破瓶颈
十三、AI安全变得前所未有重要
十四、芯片性能每年翻 10 倍， 6 年将提升 100 万倍，算力规模每半年翻 1 倍
十五、能源成为AI甚至人类文明发展瓶颈，唯一破解方法是解决可控核聚变
十六、大模型和硬件结合会带来新产业革命

当开源大模型爆发，大模型无处不在。未来AGI竞争的关键是云端超级大模型，最近美国的巨头都在进
军这个领域。大模型现在越做越小，一加推出手机，这两天斯坦福推了一个叫章⻥的大模型，可以跑
在手机上。杨元庆这两天是不是在推AIPC。
我们今天的重点是讲企业大模型市场崛起。因为现在通用大模型也遇到瓶颈。算力可能遇到点瓶颈，
英伟达挣的盆满钵满，算力的背后是能源。但我今天还发了一个短视频，他们碰到知识不够的问题
了。因为人工智能也在超越人类，之前还在跟人类学习，人类原来也没有意识把很多知识沉淀下来。
所以他们现在发展到什么程度呢？像他们最近发现，百度贴吧里的“弱智吧”原来是特别好的学习知

识的地方。这个“弱智吧”名字没起好，其实里边一点都不弱智，里边的问题都挺难回答的。我去看
了看，好多问题我都回答不出来。比如说明明是睡觉，为什么要去酒店？明明是喝酒，为什么要去夜
店？睡觉应该去夜店睡觉，喝酒才去酒店喝酒对吧？所以不要看互联网上满是数据，数据不等于信
息，信息不等于知识，知识不等于智慧。所以训大模型就需要把饱含人类智慧的高含量的知识训进
去。

OpenAI在 2021 年据说已经把能找到的人类的知识文本都用完了，因为人类一共就写了 1 亿本书，那么
多杂志期刊论文，只要数字化都可以穷尽。最后想了个方法，他们把YouTube上的视频下载了 100 万个
小时，这原来我也预言过，就是用视频来做学习，他把里边的音轨导出来，把音轨转成文字，用这个
文字来做对GPT做训练。所以这个让我们中国人工智能发展又看到了新的机会。因为过去老有人自我
讽刺，老有人妄自菲薄，看不起我们国内的这些从业者，说世界上搞人工智能，他们在搞智能，我们
在搞人工。但这个段子到今天有了正解，没有人工哪来的智能啊？我们将来发挥我们人口红利，培养
很多的人工智能训练师，我们大量的产生像百度“弱智吧”这样的内容，这样可以给我们的人工智能
做更好的训练。百度“弱智吧”里边充满了双关语，充满了深刻的逻辑和各种各样的梗，它对大模型
提高逻辑能力、提升回答技能能力是非常显著的。

多模态的发展，文生图的发展，ToC会继续涌现杀手级应用 。 知识工程成为大模型落地的决定性要素。
无论做通用大模型还是做专有大模型，知识成为决定性，没有知识的大模型就是个傻子。

Agent架构，最近吴恩达⸺著名的人工智能世界级科学家，讲了好几次Agent的课。他反复讲到
Agent架构对大模型至关重要， 这是我今天一个讲课的重点。

还有 人形具身智能机器人产业获得十倍速的发展 。FigureAI跟GPT合作做的机器人进步很快，最近斯
坦福那个机械臂当它操作不对的时候，能听懂人的指令。比如说把一个海绵塞到口袋里，海绵掉在地
上，然后人就说把口袋撑大一点，那它就能够照着人的指令完成这个任务。

还有 大模型认知能力不断提升，自动驾驶迎来革命性变化 。这话音没落，特斯拉已经在自动驾驶上，
至少暂时从电⻋的这个层次跳出来了。最近⻢斯克宣布要做自动出租⻋⻋队。

第 12 个，大模型帮助生物学科基础科学研究突破瓶颈。第 13 个， AI安全变得前所未有的重要 ，这是今
天我们的一个重点。第 14 个，芯片的性能每年翻 10 倍，大家只需要6年就能翻 100 万倍。⻩仁勋说，
未来他准备把英伟达的算力提升 100 万倍。大家觉得 100 万倍很不可思议，其实它是个指数运算，只要
每年提高 10 倍，在 6 年就能够到 100 万倍，并不需要很漫⻓。算力需要的规模我这瞎说了一下，欢迎大
家提供更准确的数据。我觉得每半年可能翻一倍，我希望测一下我们AI行业有没有摩尔定律。

第 15 个，能源成为最大的瓶颈，我这里面写的唯一破解方法是解决可控核聚变，这话现在显然说错
了，因为前两天我到⻘海大厦开会，⻘海的领导提出了一个绿色算力的概念，说他们准备拿出 10 万平
方公里全部铺满光伏板，然后他们还有⻛电，这些电也用不到，那大部分电发布到内地来，能不能就
地消化？把中国很多算力中心建到⻘海本地的话，电就非常的便宜，没准这个问题就能解决。因为中
国在再生能源方面是全球的供应链，这一点恰恰成为我们中国的优势。核聚变什么时候能出来现在还
不知道。

最后一个趋势，这个趋势今天CES已经表现出来了，就是AI和智能硬件的结合。今天可能不讲，我们专
⻔可以找一次探讨，所以这次CES上不带大模型功能的硬件都不好意思出街了。那未来什么样的智能硬
件跟大模型最容易结合？所以我觉得大模型能够把原来的打着智能的概念全部给重新改写。比如今天

说的智能手机，只能叫智能手机1.0，乔布斯 2007 年推出iPhone，到现在其实本质没变化，除了手机
越来越薄，屏幕越来越大。但是如果手机能跑大模型了，大模型能在手机底层把手机的各种传感器、
API都控制起来，那么这就变成了智能手机2.0。

同样原来智能硬件有个叫Aiot的概念，就是AIIoT，AI加上智能，那也只能叫 1 .0，因为它真的不智能。
包括智能汽⻋，我认为也要升级到智能汽⻋2.0。智能汽⻋只不过是把原来一个机械靠操控为主的，变
成了电脑来控制，但是里面并不具备大模型，所以谁真正能让大模型上⻋，对硬件产生改造。包括我
前段时间发视频，无人机跟人工智能结合，算成是大模型和硬件结合。这里边的创业机会、创业空间
非常之大，因为很多硬件一旦加上大模型的能力就会真正实现升级。

📌 我多给大家分享一句，现在的大模型可以在^4 个点给智能硬件增加不可思议的功能。

第一个，用大语言模型增加耳朵、增加嘴巴，就能听懂你说什么，能够跟你用语言做交流，
这是第一个突破。
第二个是增加大视觉模型，也就是说以后所有的硬件都会带摄像头，其实你们家的扫地机器
人已经快具备这些能力了，都带有⻨克⻛，带有扬声器，都带有摄像头接上大视觉模型多模
态能力，那么它就可以看懂发生什么，看懂自己处在一个什么环境。

第三个,大模型加上Agent架构，使你的智能硬件真正有了一个能够做推理、分析、分解任务
的大脑。
第四个，是具身智能，但具身智能我们研究的不多，是指这些硬件能不能动起来。前三个改
变对现在的很多硬件的体验来说，已经差异于过去十倍的体验了。这次小米也率人演示了小
米AI大模型，把小爱同学做了升级。有了大模型之后，这个⻋就真的像有了灵魂一样，它能
理解你说的每一句话。
这 16 个趋势信息量比较大，大家可以慢慢去琢磨，可以看看哪一条⻛口你能撞上，都会有巨大的机
会。

三、大模型不是风口和泡沫，将引领新工业革命

📍 「人工智能+」首次写入政府工作报告，打造新质生产力，企业必须拥抱AI

两会专⻔把“人工智能+”写入了政府工作报告，“人工智能+”其实就是“大模型+”，因为人工智能
落地的技术就是大模型。原来有个政策叫“互联网+”，实际上就是做产业互联网，所谓产业互联网就
是用互联网的技术帮助传统产业转型升级。那今天“人工智能+”，国家的战略是什么呢？就是用人工
智能帮助中国的传统产业，特别是制造业、现代工业转型升级，所以国家也提出来打造新质生产力。

现在在座的各位都应该往这上面靠，都应该想办法变成新质生产力整个大⻛向中的一环。所以国家也
认为人工智能是打造新质生产力的驱动引擎，所以企业必须拥抱AI。

📍 把大模型拉下神坛，才能掀起工业革命

我们看历次工业革命是怎么发生的？比如说超级电脑被发明的时候引发工业革命了吗？其实没有，超
级电脑的用戶太少，都是国家军队、气象局、地震局，后来是像玩具一样的个人电脑出现了。个人电
脑虽然便宜、廉价、简单，但是每个企业都买得起，每个家庭都用得起，所以它进入了千家万戶，进
入了百行千业，所以才产生了工业革命。
互联网也一样，互联网的前身是什么？是美国国防部搞的一个实验项目，原来连接美国一些军工单

位、大学研究中心，它并没有成为Internet。什么时候成为Internet？一个浏览器出现之后，所有的企
业、所有的个人都上网了，把全世界连在一起，互联网才产生工业革命。

所以人工智能如果只是少数人用，它就不能叫工业革命。我的一个结论是，只有把大模型拉下神坛，
才能掀起工业革命。

📍 找到关键的问题才是解决问题的关键，如何把大模型拉下神坛？

什么是关键的问题？这句话你仔细琢磨琢磨还是挺有道理。解决大家拥抱AI的关键，是要找到关键的
问题。这也是今天的一个重点。

四、企业拥抱AI的十大关键问题

我们在网上组织企业家问了很多问题，我把大家问题分了两个流派。
一路是观望派，比如说大模型技术很复杂，我们不是互联网大厂，搞得了吗？GPT3.5都免费了，就薅
点羊毛就挺好的。大模型现在还不完美，我们等等看，等到GPT5出来再说。还有人言外之意，国内的
大模型水平还没达到GPT4的水平，等到达到的时候我们再用。还有说大模型不安全，是不是等 360 解
决了安全问题以后再用？这个基本上是观望派。
但我觉得其实能当企业家的人，能当创业者的人，观望派很少，一般都是行动派。所以我也主张不用
等到这个事情很完美了才去做。我的观点是有个草台班子总比没有要强，在干的过程中，我们的草台
班子慢慢的就变得不那么草包了。
行动派的问题就问得很具体了，应该选择多大的模型？是模型越大越好吗？千亿模型能力很强，能不
能把企业的所有问题都解决了？现在名词很乱，行业大模型、产业大模型、企业大模型、垂直大模

型，这么多大模型该选哪一个？还有人问，有了大模型是不是就能弯道超⻋？原来企业里的财务系
统、ERP是不是都要淘汰？老周我没算力，买不到卡，也买不起卡，能不能搞大模型？还有人问没有程
序员能搞大模型吗？今天我们来推理一下。

1 、 2023 年百模大战，通用大模型越做越大，但适合普通企业吗？

2023 年咱们老说百模大战，我刚来之前看了一下数据，国外有个叫HuggingFace，专⻔做模型托管
的，就各种大模型、小模型、垂直模型、专业模型、通用模型，在HuggingFace上都能找到，而且都
能玩起来。你知道HuggingFace有多少个大模型吗？ 59 万。HuggingFace每秒钟都有人在上传大模
型，所以可能很快就是 百万大模型大战 了。

2 、通用大模型动辄万亿参数规模，卷得动吗？

现在有一个趋势，你看GPT5号称要做到万亿参数，也有人猜测说GPT6、GPT7能做到多少不知道，但
是英伟达自己推出那个B200号称说能训 100 万亿参数，也就是说如果训 1 万亿，花不着这么多算力，你
用算力可以反推他们的参数肯定越做越大。但是我们问，这条路真的适合在座的各位吗？适合普通企
业吗？如果按这游戏规则玩下去，我觉得中国互联网里边也没有几个大厂能玩下去。因为大家的卡是
都不够啊。所以通用大模型现在基本上是万亿，可能GPT4.5或者GPT5出来之后，万亿可能是一个基
本底线，所以他们也有人出来讲，没有 10 万块卡就不要再加入通用大模型的竞争。

我还听过一个数字说，Meta今年说要买 100 万块卡，微软至少要超过 100 万块卡，台积电的产能也就决
定了可能一年也就能做几百万块卡。美国还有那么多企业要买，还不卖给我们。所以你想想，那如果
按这个方向来卷，肯定是卷不动的。

3 、拼算法、算力、数据、人才、安全、能源，拼得动吗？

所以大家拼的是什么？拼的是算法、算力，拼的是数据。数据现在真的是都不够用了。还有人才、安

全。大家注意为什么最近GPT5一直迟迟没发布？有人就出来说OpenAI不行了，我觉得是睁着眼睛说
瞎话，我觉得最大的一个可能性，现在随着AGI的能力越来越逼近，现在各国政府对安全的考虑越来越
慎重，包括Sora也出来解释为什么迟迟没有放个人账号，他们在邀请红队测试。大家知道红队测试这
个概念吗？在我们网络安全里就是邀请一帮黑客，邀请一帮破解专家,来对我的系统做各种破坏性的试
验，找各种漏洞，我们称为叫红队攻击。因为西方是以红队为敌手，防守方称为蓝队。我们网络安全
上我们也经常搞，我们的防守方称为叫红队，我们的攻击方称为叫蓝队，这跟西方这样是反过来的。
所以他们现在最大的一个顾虑是安全。

当然拼数据、拼算力，最后就拼能源。我的观点是我们在座的普通企业家就不要去加入这个游戏了，
这个游戏我们玩不起。

4 、通用大模型AGI之路如何走通？举国之力，国家统筹、大企业合力

两会我写了一个提案，我们画成两条路，一条路是通向AGI的，叫超级通用大模型之路。这个不需要
100 家公司干，这个需要几家大家伙在国家统筹下把算力集中起来，把数据相互打通，以举国之力，一
个国家有那么一个就很了不起了，这是我的观点，否则大家现在每家都有个几万张卡凑起来，全部加
起来可能也就 100 万张。
美国最新的叫BG200，超级计算机，它把那个计算密度做到了极高，它训个万亿模型，比如说 3 个月就
能出结果，一年能训 4 次，我们集群算力不够，那就靠耗时间，这算一年多结果没出来，你怎么去竞争
呢？所以我觉得这是一条路，但这不是唯一之路。

5 、通用大模型自己训？模型不贵，训练很贵，有钱买不到卡

我为啥主张创业者不要轻率闯这条路？我没有瞧不起创业者，如果你真的忽悠能力很强，有很强的现
实扭曲力，融到了 10 亿美金以上的闲钱，而且投资人短期内不要求回购，投资人不要求托底是可以考

虑的。我们国内很多VC现在投资都是要求有保底、有回购。这钱随便花，就像当年⻢斯克给了OpenAI
几亿美金一样，这钱随便花，那我觉得你加入这个竞争是没问题的。

否则的话我们把企业级大模型和这条路分开。就企业级大模型一定是走另外一条，这是不同的战场，
敌人都不一样，战斗力也不一样，需要的能力也不一样，所以两个战场的游戏规则不一样。有人就来
问我，说我们自己也训个通用大模型，现在真的不贵，因为开源的千亿模型也有，像⻢斯克开源了他
的Grok,databreak开源了它的1300多亿的,⻢斯克的是 3410 亿的模型。那么训练很贵，训练这种模型
的起价至少 1000 万吧， 1000 万也就训练了一次两次，而且现在关键问题是你有钱，你真的确认你能买
到卡吗？那我们再换条路。

6 、图省钱，薅公有大模型羊毛行不行？

有的企业家很聪明，说咱们省钱，咱们薅公有大模型的羊毛行不行？就是我直接套壳借用几种GPT。
用它解决一些个人的问答问题是没问题的，但是这里面有两个问题。

7 、公有大模型拥有的都是公开知识，没有行业深度，也不掌握企业专有知识。

通用大模型拥有公开知识，你们用一用就知道做通用办公、通用营销是没问题的。如果问到跟你的企
业业务有关，跟你的行业有关的问题，就像一个咨询专家，完全不懂你企业内部的行业知识，不懂你
企业内部知识，总是说一些通用的企业管理经营理论，它对你意义有多大呢？

8 、你愿意把企业的核心知识贡献出来，当行业雷锋吗？

大模型拥有的我们都叫亮知识或者明知识，就是互联网能找到的知识，大模型都能用。但是我们企业
和在行业里我们是有很多自己积累的内部知识，你愿意贡献出去吗？
你怎么可能舍得把你积累了和做了 20 年积累的知识送到公有大模型，把它训进去教给它，然后这样你
就为行业做雷锋了，整个行业因为你都得到了进步，这是对绝大多数企业家来说，这是不可想象的。

最近GPT说愿意用在云端帮你们定制模型，你真的能信吗？最近Facebook已经一个亿美金把所有的聊
天记录都卖给了一家公司，你们知道吗？卖给了PinterestRay，美国有一个美国版的贴吧，它最大的
收入来自于它把贴吧的数据卖给这大模型公司播放，巴不得把你的数据尽可能上传，希望你去定制你
的GPT的时候，把你很多数据、知识都给他，他现在正处在知识饥渴阶段，你的知识都给他了，他能
不用吗？当然你现在要定制的话，那就是把你的核心知识贡献出来，那我觉得绝大多数，我也不愿
意，我宁可训一个自己的专有大模型。

9 、你愿意把数据和隐私开放给公有大模型，让企业裸奔吗？

这些公有大模型都是聊天机器人，你在跟他开会，跟他做很多沟通，把你的想法、一些原始素材给
他，这样很多数据就暴露了。所以现在你看各家互联网公司都为什么有自己的编程大模型，而不会用
公有的编程大模型？公有的编程大模型根本没有企业内部的代码的训练，它在企业内部根本是无法使
用的。但一个大模型如果训练了企业内部的代码，有了内部的知识之后，这个大模型就一定要私有，
才能变得放心。

10 、公有大模型就是个聊天机器人，能和业务系统深度整合吗？

这我也跟大家唱唱反调，公有大模型为了让大家都好用它，最早是为了让ToC好用，它又想照顾ToC，
又想照顾ToB，所以他就做了一个聊天机器人的界面。这聊天机器人又好用又难用。

好用是说你猛然一上手，会聊天就能用，这样就入⻔，很简单，但是你真想用、用深，你发现他对提
示词的要求很高，而且提示词很不稳定，所以有人就说了，说 21 世纪大家都要变成提示词工程师。我
原来也同意这个看法，但我现在持否定态度。我认为这就是OpenAI发展最大的瓶颈。因为搜索虽然功

能有那么多不全面，但是搜索每个人用起来非常简单好用，但是大模型是会用的人觉得如获至宝，不
太会写提示词的人用起来还不如搜索引擎呢。搜索引擎至少还能帮你找到一些资料，大模型有时候会
胡说八道，所以提示词绝对不是最好的人机界面。
特别在企业里边，它如何跟你的业务系统深度整合？这又是一个矛盾。不整合，你用公有大模型，每

天就相当于请了一个顾问，只能叨叨给你提建议，你还得把它说的话copy下来，再转到你内部去分
发。但是你把一个公共大模型跟企业内部的API接起来，那你就被外部的大模型控制了，这个从安全上
说不过去，所以公有大模型可以用做一个参照，但是真的放在企业内部，我觉得是不合适的。

五、THINKDIFFERENT⸺大模型发展并非只有一条路，除了越做

越大，还能越做越专

这里我就举一个例子，叫thinkdifferent，这句话是谁的广告？苹果的。你再想想ARM是怎么打败
Intel的，Intel当年做CPU什么思路？越做越大，越做核越多，越做主频越高，越做温度越高，不是越
做算力越强。那ARM跟那AMD跟着Intel后面竞争做similar的这种业务，所以一直就得不到太多的市
场份额。现在AMD的市场ARM跟Intel在X86CPU上还是比较小。ARM走了另外一条什么路？ARM必须
锋芒。我走算力很小，但是功耗很低。我不进主流的桌面，不进主流的服务器，我就进一些边缘智能
硬念产品或者手机，然后ARM就是曲线救国，这就是一个典型的thinkdifferent的一个典型的思路。
但是慢慢等ARM规模做起来了，今天ARM重新杀回了服务器市场，重新杀回了桌面，甚至现在很多PC
端，包括你们用的苹果的Mac笔记本，那里边的CPU都已经不是X86了，都是ARM体系的，所以这就
是另外一个思路，就我跟你就是不一样，反其道而行之，所以thinkdifferent这个思想。

当然对于很多企业家来说，我觉得不仅在这个上面可以去体会一下在你面临竞争的时候，你是真的要
跟你的竞争对手，跟你的同行做的都一模一样吗？还是说要反其道而行之？就像那天我自己很发愁，
太想涨粉了，就去研究抖音的规则，按照他的规则我周鸿祎就不是我了。学会头5秒钟说一句很夸张
的话，我这有挣钱的秘诀，你看到结尾啊。如果以后你看到那个周鸿祎在视频里，那他一定是数字
人，不是我本人。因为我本人对着镜头，每次我要努力的装出这种样子来，真的很难。然后按照抖音
的规则，我的视频太⻓了，每次都至少三五分钟，有的视频⻓达了15分钟。抖音讲究的是一分钟内解
决战斗，后来我也想明白了，我真的做不到。为什么呢？你真的觉得一些人生的道理、企业基因的经
验能在30秒、 1 分钟讲完？它一定是情绪价值，没有真实的价值。按照thinkdifferent这个思想，我继
续坚持，我行我素，大家都做短视频，我就做⻓视频，没准过两天当短视频信息量下降、质量下降
了，大家愿意看⻓视频的时候，大家可能愿意来看我的东西。所以thinkdifferent也是让你显得与众
不同。

所以按照这个思想大模型发展，我认为并非只有一条路，除了越做越大之外，还应该走一个叫越做越
专的路。为了证明我这个想法，我们谈几个趋势。

大模型三大趋势

1 、做多个专家小模型混合的MoE架构

第一个MOE这个概念大家知道吗？就是mix，就mixofexport。从一开始关于 GPT4就有传言说
GPT4看起来是一个千亿模型，实际上是16个专业模型组成的。那么伊隆⻢斯克公布了Grok里边就是
一个moe加工，也就是说今年大模型在越做越大的时候，他们也面临一个挑战，为什么呢？因为你今
天大模型如果是一个完整的大模型，它为什么比人脑功耗要高呢？你只想人脑里边，其实我认为是有
多个大模型在联合工作的，虽然人脑在物理上是一个脑子装在脑壳里，但你想一想，人那大脑有运动
中枢，有视觉中枢，有语言中枢，也有做这个文字的处理的，也有做记忆的，所以你问我2+2等于
几？让我来讲一堂课，我调用大脑里面一定是不同的区域的工作，但是今天你让大模型给你写一篇 2
000字的文章，和你问大模型2+2等于几？大模型消耗的算力、调动的运算量是一模一样的。所以现
在大模型的算法Hinton发明的这个反向注意力这个机器深度学习这个算法本来就在一有意的在模仿大
脑的工作原理。所以现在大模型也在做，把一个大型的架构拆成多个小规模的大模型，所以那么就反
过来证明，就是说当你问大模型问题的时候，并不是它的 1 万亿参数同时在发挥作用，它可能从16个
小模型中挑了两个小模型来激活来回答你的问题。那我也可以想象，现在这些技术秘密可能还没有被
泄露出来，那将来一定会走专业化的路径，你同意吗？可能有。因为现在大模型我们在训练过程中发
现一个很痛苦的情况，在座的诸位有没有训过大模型呢？你想让它提高点运算能力，你就准备了点奥
数题去训它，结果发现它的历史能力或者外语能力就下降，你再改完就再给它灌输点物理或这个外语
题，它的文学能力又下降，反正按下葫芦起了瓢。所以最后发现说每次学习的时候，就得把各种各样
的知识均匀地弄一份。所以未来我们做垂直模型之后就可以避免这个毛病。比如我专⻔有个做计算的
模型，如果你觉得我计算力比较弱，我就专攻这个模型，这个模型不会做翻译，我专⻔有个做翻译的
模型，那我就可以把翻译做得很强。事实上我已经这么做了，一会我给大家汇报进去。

2 、大模型终端化，上⻋上手机上P C

第二个，大模型做小的趋势已经出来了，就大模型终端化，刚才我已经说了，上⻋、上PC、上手机，
对吧？今年联想最近也是要拿AI来重塑PC产业，其实这个趋势也可以想象。有人就问我了，大模型在
云端的话，现在的时延最好能做到 500 毫秒，那么做一些简单的问答在⻋里也许还能忍受，但是将来你
让大模型在⻋里能控制你的⻋身、智能座舱，如果再跟你的自动驾驶再揉到一起，这个反应速度是不
够的，这时候大模型必须要上⻋。大家就问联想的AIPC有什么用？我告诉你用处可大了。将来你家里
如果有一个人形机器人，等你老了给你提供服务，这人形机器人怎么得有一个大模型驱动嘛,这个大模

型应该放在云端还是放在你家呢？你大家想想，肯定不能放云端啊，一断电了这玩意就死了，被hack
了怎么办？我遥控你们家的大模型，然后用你们家的机器人把你给消灭了。

还有一个他知道你所有的隐私，你在家里穿着小裤衩跑来跑去的时候，全被大模型看在眼里，这数据
肯定不能传在云端啊。 所以大模型上终端一定是一个趋势。

我跟大家预言，因为苹果有研发CPU的能力，因为它的GPU也很强，那么苹果一定它的大模型，它现
在可能会暂时跟Gemini合作，现在会暂时和百度合作，但是苹果一旦自研的大模型出来之后，一定会
跟手机深度整合的。因为手机今天是了解我们个人隐私最多的东西，手机都不是一个物件，手机是我
们每个人新⻓出来一个新的器官。

3 、开源大模型爆发

第三个趋势就是开源在爆发。有的人不相信开源的力量，但是你可以看一看，说最近开源的发展，虽

然闭源你依靠一家公司OpenAI现在暂时领先，因为它比别人先发了 5 年嘛。但现在开源的速度，因为
开源有了一个生态之后，开源的发展非常快，而且美国开源都不是一个单纯的开源，除了像背后都有
很多大公司的支持。所以我举个例子，如果OpenAI把GPT免费了，它的目的实际上我认为是在想消
灭搜索，是Google一年几百亿上千亿美金的一个生意。这具体的收入我没查，大家可以具体查，应该
是在这个量级，那Google就会非常难受，但是那Google怎么反击呢？我说我要给Google支招，
Google的招数就是把Gemini给开源了，让美国每家公司都有一个不逊色于GPT4的大模型可以用，
而且可以免费用，减少人们用GPT4。所以当年你知道Linux没有Linux的开源，就没有互联网，这个
话没说过错，但是你知道谁在背后支持Linux？除了这些程序员之外，像SCAN公司，像Oracle，还有
像IBM，微软的老朋友、老友商都在拼命的给开源的Linux在贡献代码，贡献核心技术。

相信开源的力量， 360 智脑开源 70 亿参数大模型，支持文本⻓度最⻓

📍 市场经济下的集中力量办大事，我为人人，人人为我，不闭⻔造⻋，不重复发明轮子

所以我认为开源的最近的这个爆发，实际上给大家提供物质准备，因为你要做垂直大模型，你不可能
走既用GPT，GPT也不可能 4 给你。那我们以前是依据开源来做我们自己的垂直大模型，我一直主张开
源，我们讲我们有个体制优势，对吧？叫新型举国体制，就集中力量办大事，当年在中国研制两弹一
星，在今年中国的军舰航母不断地下饺子一样下水啊，在我们各种科研成果上其实获得了很好的验
证。但是咱们也不能小瞧美国人，西方在市场经济下它可能很难通过政府的力量把一些公司拉到一
起。但是它通过一个开源社区，他把很多公司拉到一起，把很多自由程序员拉到一起，所以我认为他
是市场经济下的集中力量办大事，形成了一种我为人人、人人为我的文化，而且最关键的它不闭⻔造
⻋，不重复发明轮子。开源社区为什么这么发达？你贡献的一些想法和代码，那我在你的基础上受到

了启发，我又贡献了一些知识，相当于他没有一个公司在主导，但是很多公司的成员都在参与完了，

大家共享这个成果。所以伊隆⻢斯克很聪明，伊隆⻢斯克把grok开源，并不是说他是一个伟大的共产
主义战士，你们把⻢斯克都给神化了，他显然干不过我们AI，他也没有那么多人力,那怎么办？就把它
开源了，就变成全世界的人可能都在帮我在改善。所以国内像李开复的那家公司叫什么？他写了个Yi，
我就感觉这不是侵犯我的名誉权了吗？哈哈，所以要谢李开复，他的产品用我的名字来命名，我不知
为什么呢？为了要纪念我吗？然后 360 最近也做了一个开源，所以现在这前面M eta的开源，这个XAI的
开源，Meta开源到现在不到两年，所以开源现在跟闭源之间的距离应该说已经没有那么大了。

📍^360 智脑开源^70 亿参数大模型，开源模型中支持文本⻓度最⻓

所以360智脑也我们开源了70亿参数的一个大模型，然后我的特点是支持中文的文本最⻓，因为前段
大家在卷这个输入文本的⻓度，先是20万字200K，后来到100万字，其实真的 100万字你也用不
了，而且开销特别大。这个也只能大家强努一把力，所以我们开源了360K，相当于36万的⻓文本，

36万的token。差不多汉字相当于是50万字，所以我们也希望就大家不要在这卷了，把这个能力这个
送给国内所有的垂直大模型。所以此处加点广告，大家可以理解。

六、企业走垂直大模型要走“越来越专”的路

所以我们就能得出一个结论，企业大模型应该走越做越专的路，在企业里面找垂直的场景，做专业的
技能。

📍 找垂直场景，做专业技能的大模型，不做全能博士，做企业管培生

📍 不需要千亿万亿的参数，百亿十亿就够用，单机单卡就可以，从原子弹变成茶叶蛋

📍 不需要投入几千万上亿资金，百万、十万就可以，中小企业都用得起

📍 不需要面面俱到的能力，不需要等GPT5，GPT3.5级别就够用，现在就可以拥抱大模型

📍 实践证明，百亿参数的场景大模型训得好，专业能力可以超越GPT4

案例： 360 安全大模型

360 为什么要做安全大模型

躬身入局、以模治模，用“模法”打败魔法

2024 是场景之年，关键要结合业务找对“明星场景”

场景案例：360AI浏览器

七、企业走垂直大模型面临的五大关键问题

定义场景需要业务驱动，比如你和 360 合作， 360 能帮你解决训练大模型工具问题,但是选择什么场景是
由你的公司来决定的，是由你公司在业务一线的这些人来决定的。

关键问题 1 ：AI科普

大家有没有发现，AI和云计算大数据不一样，它跟全体员工都有关系。我们公司上云，用大数据，绝
大多数员工不需要关心这件事， AI是一个需要全员做科普、普及的一个技术。所以我们认为大家在拥
抱AI的时候，这不光是老板的事，在内部让你的全职员工都要使用AI。如果大家都不用AI，对AI有各种
莫名其妙的恐惧、误解，甚至觉得用AI会导致我离职，会导致老板更加剥削我，那这个公司AI是搞不起
来的。

关键问题 2 ：知识管理

关键问题 3 ：AI安全

关键问题 4 ：模型打造

📍 企业大模型不是从^0 开始训练，是从千亿模型蒸馏出来的百亿模型

换句话说，它还是具备了千亿模型很多通识教育的基础，它怎么也是达到一个高中或者大专毕业生的
水平找我们做训练。

📍 吴恩达：“GPT3.5+Agent优于GPT4”，Agent框架能解决什么问题？

稍微讲点技术，吴恩达最近一个观点我非常赞同，“GPT3.5+Agent优于GPT4”。你可以认为，现在
做一个大模型，如果没有Agent架构，大模型将会一事无成，特别在企业内部。因为大模型的能力还有
很多欠缺。 Agent架构恰恰能够在企业弥补大模型的很多不足。

📍 Agent框架增强大模型^6 大能力

中文我们把Agent框架翻译成“智能体”。它能增强大模型的六大能力⸺交互增强、模型增强、规划
增强、记忆增强、知识增强和工具增强。

📍 Agent框架解决“慢思考”问题

我简单来解释一下。它要模拟人脑，人脑的系统里面有两套系统，一套叫快思考，一套叫慢思考。快
思考就是生物本能，慢思考就需要衡量。今天大模型快思考的能力已经超过人类了。大模型回答问题

不一定对，但是大模型自己没法反悔，所以Agent架构里引入了一个框架。就是说我们可以用Agent框
架来让大模型进行反思，对自己的答案进行检测，进行二次回答，所以大模型不是只调用一次就能出
最好的结果。
打个比方，你来跟问周鸿祎，要求说我⻢上回答，不许修改、不许出错，一气呵成，我也做不到。其
实真要讨论一个问题，肯定是经过很多次，慢慢就能找到答案。这才是人脑真正的工作过程。所以

Agent框架可以让GPT3.5多次工作。我上次举了一个例子，你找一个翻译专家，他也不会只翻译一
遍，他会先粗粗翻译一遍，然后再进行润色修改，再来对照原文。那现在你给大模型说把这篇中文翻
译成英文，凭什么就要求大模型一次就到位呢？如果你要求大模型做三次，我告诉你翻译的结果会比
第一次好很多。所以在企业内部Agent架构非常重要。

📍 RAG知识增强，RAG可为大模型提供知识增强和知识对⻬，提升事实准确性，降低幻觉

大模型会出错，要防止它出错，就要做知识对⻬。这个知识对⻬既包括内部知识，也包括外部知识。
所以最近 360 推出来的360AI搜索，我用起来就很放心。他所有的答案都先在网上搜一遍，把网上搜到
的东西做了理解，再来给我做答案。而不是无中生有瞎编。

📍 Agent框架解决“专家协同”问题

企业未来会有多个专业大模型，我们提出来一个COE的概念，多个专家模型扮演不同的⻆色，就类似
人的大脑，有不同的语言中枢、规划中枢、判别中枢、记忆中枢一样来进行协作。

📍 Agent框架解决“人机界面”问题，不要迷信Prompt

在企业里边，如果你全是prompt，这个企业用大模型一定会失败的。因为你的员工能力水平参差不
⻬。你想我们人跟人之间沟通还特别费力，你要求你的员工都是prompt专家，所以prompt这种界
面，我们称叫LUI。有人说会彻底否定掉GUI这个观点是不对的。大模型通过Agent框架会把你企业原
来的API和常⻅的鼠标键盘界面连在一起，这种操作对员工可能是最简便的。

我们也在探索一个CUI，就一个聊天室的数字人的界面，但从现在来看，它作为一个补充是可以的，因
为你什么事都要跟通过语言方式来表达，在企业内部并不是最高效率的。

📍 Agent框架解决“工具增强”问题

大模型的能力实际上是很弱的，很多事都干不了。比如你让它订餐、订票、查航班，它必须有很多工
具向它开放。大模型才有了手跟脚，那除了外部的工具之后，在企业内部我们有很多系统，你能不开
放吗？假设啥都不让我碰，什么数据库我都没有账号，那我只能给你夸夸其谈，但是如果我都能操纵

这些东西，那我作为一个专业员工，我就能发挥作用。所以如果没有Agent框架，光有个大模型，在企
业内部实际上啥活也干不了。

关键问题 5 ：业务融合

企业大模型不是顾问，他不能只说不练，也不能取代原来的IT系统，它要和你原来的业务系统紧密耦
合在一起，协同工作，所以这就需要一套工作流。
我举一个例子，比如你做了一HR，面试只是一个单点功能，面试完了之后我怎么把面试结果发到公司
HR系统里？我怎么通知HR这个人录用或者不录用。实际上这些功能都不是大模型在做，都需要一套工

作流系统，把大模型Agent框架的能力跟企业原来的业务系统紧密的连在一起，实际上需要一个更大的
Agent框架。所以我们讲企业做大模型不再是问题，第一知识管理的问题,第二大模型训练中Agent框
架的问题,第三业务融合的问题。所以在企业里面打造大模型，并不像大家想象的那么简单。