周鸿祎：未来属于正确使用大模型的人

大模型_

已于 2024-05-09 18:00:54 修改

阅读量376

点赞数 3

文章标签：自然语言处理人工智能 AIGC 产品经理计算机网络

于 2024-04-16 16:11:19 首次发布

本文链接：https://blog.csdn.net/2301_76168381/article/details/137829308

版权

本文讨论了大模型如ChatGPT的崛起，强调其具备真正的智能并通过OpenAI的创新展示了人工智能的新时代。文章指出大模型在企业级市场中的潜力，涉及大模型训练、应用场景、安全原则以及未来发展趋势，如行业深度化、企业个性化等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

■ GPT不是搜索引擎，也不是聊天机器人，它代表着超级人工智能时代的到来。

■ 出现“幻觉”恰恰是大模型智能的体现，也是它最“可怕”的地方。

■ 有批判精神、有想象力、会提问，是人工智能时代人才的关键特质。

■ 大模型发展要顺势而为，服务产业数字化战略，提升政府和企业的生产力和生产效率。

在上周举行的2023复旦管院校友上市公司发展研讨会上，360集团创始人周鸿祎带来了“大模型时代的机会在企业级市场”主题演讲，围绕大模型训练、通用人工智能发展趋势、企业级市场落地、大模型安全原则等话题分享了精彩观点。

以下内容根据现场演讲整理

大力出奇迹：

大模型训练的“暴力美学”

在OpenAI之前，所有公司都点错了“科技树”，没想过用“大力出奇迹”的方式训练大语言模型。

这次的人工智能和原来的人工智能不太一样。原来的人工智能是人工“智障”，像Siri、智能音箱、网联车的语音助理，可以说几句简单的指令，复杂的理解不了。所以很多人会质疑，这次的人工智能大模型拥有真正智能吗？我觉得这是认知上的问题。如果你认为它是假的，可能会忽视它；如果你认为是真的，就会认真思考，怎么把握这种趋势。

这次大语言模型用到的算法和模型实际上是组合式创新，算是AI技术的集大成者。比如底层的Transformer模型是谷歌发明的，国内的互联网公司都在用。OpenAI最大的创新是做对了一件事——大力出奇迹，他们想到了能不能把全世界的知识在一个大模型里训练，在这之前，没有人敢于这么去想。

大数据加上大算力、大标注、大算法、大流量才变成了大模型。ChatGPT 为什么能够出圈？OpenAI不仅在技术上解决得很好，在两件事上也做得很漂亮：

一是他们把它包装成了聊天机器人。“伪装”成聊天机器人的SaaS（软件即服务），用户会聊天就会使用，这让普通人和人工智能的距离为“零”。但它不是聊天机器人，这个一定要强调。

二是找对场景，解决老百姓的痛点和刚需。再伟大的技术创新，都需要场景支撑解决实用问题。过去的AI产品都是技术专家“自嗨”，普通老百姓没有感觉到，但这次OpenAI的概念影响到了全世界几十亿人，这也是非常值得我们去学习的。

这次不是“狼来了”：

大模型已经拥有真正的智能

大模型到底有没有智能？图灵测试的本质就是拟人对话的实验，当机器能够完成与人类的自然对话，就意味着拥有人类的智慧。

在这之前，计算机的数据库和搜索都是信息的存储和检索。但OpenAI是人类第一次实现把人类的知识、理解编码，基于知识能做推理、做规划。

微软和OpenAI合作之前，大家都觉得会不会只是一个新的搜索。你问它上一届世界杯的冠军是谁，这种问题根本不体现智能性，因为事实性答案用搜索就能搜到。“小明想把沙发装到箱子里，装不下，它太大了，他是谁？”这是经典的逻辑学和语言学问题，如果没有对人类世界知识的理解，仅靠语法分析是分析不出来的。

GPT有一个最基本的点，就是你怎么跟它聊天，它一定能坚持聊下去。你不会觉得它是一个机器人，它有时候说话的“油滑劲”简直就像一个世故的中年人，当然这都是公司给训练出来的。

人和动物最大也最本质的差别是人类发明了语言来描述这个世界的知识。你对这个世界的很多知识不是先验的，是通过对语言的学习。谁能真正理解语言，就建立了对世界模型的理解，ChatGPT是人类第一次做到这一点。

尽管今天一个新生事物有很多缺点，这些缺点只要不是致命的问题，未来可以通过迭代更新、自我演化来升级。

所以说，大模型的出现代表了人工智能新时代的开始。大家不能错过这个机会，这次不是“狼来了”，不要把它仅仅当成一个玩具。

四个不可解释的现象，

人类打开了“潘多拉之盒”？

大模型有四个不可解释的现象，证明了它拥有真正的智能。

第一是涌现。大模型有一个参数规模，大家都会问做了模型，参数是多少？有人说100亿、1000亿，还有人说未来做1万亿。参数怎么理解？把它想象成人大脑里神经元和神经元的连接，人类大脑不像内存、硬盘是线性存储，人的大脑是非线性存储。人脑的联想不仅由神经元存储信息，这些信息之间充满了无数连接，所以参数可以比喻成模拟了大脑皮层神经元的“连接数”。原来没有推理能力，连接数过了六七十亿之后开始产生一定的能力，过了五六百亿之后，能力突然增强。就像生物进化，地球本来没有生物的环境，后来从单细胞演变成今天复杂的生物圈。但是科学家解释不了，就叫“涌现”。

第二是幻觉。很多人担忧GPT会产生幻觉，当它不知道怎么回答的时候，居然会“一本正经地胡说八道”。比如你问它“贾宝玉倒拔垂杨柳”，它真能给你编一段出来。但是正向地看，这不恰恰是智力的表现吗？出现“幻觉”恰恰是大模型智能的体现，也是它最“可怕”的地方。

《人类简史》里提到，人类进化中和大猩猩有一个很大的分水岭。大猩猩可以学会认五个香蕉，三个苹果，也可以接受简单的指令，但它永远无法理解不能发生的事。人类进化的一个关键点就是人类是唯一有能力产生幻觉的动物，能描绘不存在的事。人类也会说谎，想想创造力是什么？创造力就是创新，把几个不相关的概念，扭到一起产生链接、产生创造。搜索再强大，也只能搜出已经存在的东西，有就是有，没有就是没有。今天大模型的创造力已经在不断涌现出来。

第三是语言能力迁移。OpenAI的训练语料里，中文占比可能不到5%，其他语言的比例高达95%。我们曾经以为阿拉伯文、日文、中文、拉丁文字的规律是不一样的，但是他们发现训练到一定时候，所有语言背后的规律都发生了作用，例如在英文上学到的知识能力，在其他语言上都能很好地回答。所以，OpenAI虽然只有5%的语料是中文，它的中文能力还是相当强。

第四是逻辑增强。计算机语言也是一种形式化的符号表达。为了训练编程能力，给它读了很多源代码，然后发现它不仅学会了编程，在用自然语言回答问题的时候，逻辑感、层次感也得到了极大增强。这几个现象证明了这次人类可能确实打开了“潘多拉之盒”，也可能实现了真正的突破。

超级人工智能时代开启，

大模型把“石油”变成“电”

大模型对传统人工智能而言是一场颠覆性的革命。

GPT3.5是一个拐点，是人工智能走向通用人工智能的拐点。GPT4是超级人工智能的雏形，它已经是世界上最聪明的“人”。很多人对GPT4的用法不对，把它当聊天机器人“玩”。

大模型是通用人工智能，可以用一套模型、算法、数据解决所有自然语言理解的问题。大模型从感知进化到了认知，能够理解文字、语言、分析、规划，会成为未来很多新的人工智能底座。任何人工智能问题首先要基于大模型，因为它有基于对世界的理解。大模型将在自动驾驶、机器人控制、蛋白质计算等领域“大显身手”。

一定要站在未来看现在，站在现在看未来。GPT不是媒体，不是玩具，不是搜索引擎，也不是聊天机器人，它代表着超级人工智能时代到来。

现在已经有很多科学家在讨论，当人类已有的书本知识训练完了，我们用什么来训练这个超级大脑？答案是全社会的摄像头。对它来说，今天识别视频已经不是问题，通过这种学习可以想象一下，它的进化速度会有多快。

未来属于会正确使用大模型的人。GPT是这个时代最伟大的工具，凝聚全人类的知识成果。它赋予普通人更强大的能力，解锁专业技能，发挥聪明才智。年轻人有机会借助GPT拉近和前辈的距离。有批判精神、有想象力、会提问，是人工智能时代人才的关键特质。人工智能发展的终极目标是人机协作。

大模型目前的工具属性非常强，是人类有史以来发明的最有力的工具。把人类几千年的知识浓缩在一个模型里，通过一个聊天接口，让每个人都能拥有。我觉得在企业里要采用大模型，首先能提高组织效率，提高员工能力，特别是新员工的培训入职。它还能解锁人的很多能力。目前大模型还有很多不完美的地方，让它独立完成一项复杂工作基本上没有可能。它给企业做规划战略的时候，还得加上人的判断。

大数据不是数字化的终点。大数据有点像石油，虽然很宝贵，但是不能直接用。你不能直接把石油灌到油箱里，大模型正好解决了这个问题，就是把大数据训成大模型，就像把石油变成了电一样。

一旦变成了电，就可以提供很多通用的能力，注入到企业。大模型不是操作系统，而是数字化系统的标配。大模型未来将“无处不在”，大模型在中国的发展之路不会走向垄断，大模型的发展路径接近计算机，大模型的趋势是做“小”做“专”，在电脑和手机上跑起来，每一台智能汽车上也会有大模型。未来每个家庭、企业、政府部门都有至少一个大模型。

增量市场机会巨大，

企业级落地面临“七个问题”

大模型分成两个市场。一是巨头把持的存量市场，二是行业企业开创的增量市场。

真正的增量在于企业级市场，特别是传统行业。传统行业都在做数字化转型，而大模型和云计算不太一样。有一定规模的企业不会选择接入云端通用的大模型，而是会把大模型变成自己的核心数字资产。

大模型发展要顺势而为，服务产业数字化战略。大模型在中国应该高举一个旗帜，就是为传统产业赋能。大模型应该“放低身段”，去提升政府和企业的生产力和生产效率，要跟企业走到各个场景中，跟企业实践结合。

企业级场景落地公有大模型面临“七个问题”：第一，缺乏行业深度；第二，不“懂”企业；第三，数据安全隐患；第四，知识更新不及时；第五，胡说八道；第六，投入巨大；第七，无法保证所有权。

大模型未来的发展趋势是“六个垂直化”：

第一是行业深度化，在通用大模型的基础上做行业数据的训练，把“本科生”训成“博士生”。

第二是企业个性化，和企业内部Know How紧密融合，更懂企业。

第三是能力专业化，一个模型解决一个专业领域的问题，落地形态是多个垂直模型的组合。

第四是规模小型化，做小规模的大模型，百亿参数的大模型成本更低，部署升级也更灵活。

第五是部署分布化，将来企业的大模型既可以部署在云上，也可以部署在终端上。

第六是所有权私有化，企业要拥有大模型的所有权和控制权。

大模型要完成从“天才”到“管培生”的转变。垂直模型也要在经过市场验证、有足够能力的通用大模型基础上训练。在互联网上先把一个通用的大模型基座训出来，相当于达到本科生水平，然后再落实到企业内部，效果就会好很多。

构建企业级垂直大模型难度比通用大模型低了很多，不要等到大模型无所不能才开始干，想清楚场景，现在就可以开始干了！

坚持安全发展“四原则”，

AI普惠为人赋能

只有解决大模型安全的问题，大模型才能得到真正发展。谁能解决大模型“幻觉”问题，就相当于摘下了“皇冠上的明珠”。

一、安全可靠原则：所有大模型都有漏洞，包括网络安全方面的大模型窃取；数字安全方面的数据隐私攻击、投毒攻击；算法安全方面的提示注入攻击、逃逸攻击。

二、内容向善原则：AI如何不作恶，不违背人类伦理道德，生成内容要安全，例如AI换脸诈骗，生成恶意软件，网络钓鱼问题等。

三、结果可信原则：通过搜索校正、知识校正、对齐训练，解决“幻觉”知识模糊，知识不能及时更新问题。

四、能力可控原则：不要一开始就把控制权交给大模型；要确保“人”在决策回路；不能出现“不可撤销”的后果。

你做了一个大模型让人人都能用的时候，无数人会想出很多方法让这个大模型去犯错，这里有特别多的安全问题，而做垂直大模型是最安全的。我们也在研究用大模型来“治”大模型，就是说如何把大模型的能力关在笼子里。

大模型不是万能的，它目前最成熟的能力是自然语言处理，其实就两件事：知识问答、写作辅助。先把通用大模型最擅长、最成熟的能力用好，从办公场景的“刚需”切入，做到“小切口、大纵深”，从大模型最能提升企业办公效率的点切入。循序渐进，先让大模型担当“副驾驶”角色，大模型可以导航、给建议，不会乱抢“方向盘”。

大模型发展要“以人为本”，坚持AI普惠的概念。从上到下每个人都用起来，企业对AI的理解才会更深入。大模型作为生产力工具，应当为人赋能，而不是为了裁员。

大家对大模型要建立一个认知，你可以不用，但这件事不是虚假的风口或者泡沫，真的是人类人工智能的发展到了拐点。未来5到10年是一场产业革命，开发通用大模型并不是今天唯一之路，做产业大模型生逢其时，应该会有先发优势。

大模型岗位需求

大模型时代，企业对人才的需求变了，AIGC相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。
在这里插入图片描述

掌握大模型技术你还能拥有更多可能性：

• 成为一名全栈大模型工程师，包括Prompt，LangChain，LoRA等技术开发、运营、产品等方向全栈工程；

• 能够拥有模型二次训练和微调能力，带领大家完成智能对话、文生图等热门应用；

• 薪资上浮10%-20%，覆盖更多高薪岗位，这是一个高需求、高待遇的热门方向和领域；

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。为了让大家少走弯路，少碰壁，这里我直接把全套AI技术和大模型入门资料、操作变现玩法都打包整理好，希望能够真正帮助到大家。

-END-