吴晓波对话百度沈抖：打开一张19个月的大模型成绩单

百度智能云

于 2024-10-14 18:38:45 发布

阅读量62

点赞数

文章标签：百度

原文链接：https://mp.weixin.qq.com/s?__biz=MzA5NTQ5MzE5OQ==&mid=2653143783&idx=1&sn=561c5995798f1294c4e7abd2ec130ec8&chksm=8a58091682bf8de8cde7af446749b25fc50aa13808c2288ec94df1b3115e5a0c7e2091ae750e&scene=126&sessionid=0

版权

大模型蓬勃发展，正在从技术变革走向产业变革。

日前，在2024百度云智大会期间，著名财经作家吴晓波现场体验百度大模型落地成果，并与百度集团执行副总裁、百度智能云事业群总裁沈抖展开精彩对话，从百度智能云大模型发展迭代到产业应用，从大模型基础设施建设到未来大模型生态的发展，全面而又深刻地展示了大模型对当今社会的深远影响及其未来的发展趋势。

以下为对谈观点摘录，经整理编辑：

“第一张船票”

吴晓波：非常高兴能在北京秋高气爽的季节来参加百度云智大会。刚才沈抖总带我去看了一些展台，我发觉产业智能化和互联网公司之间的衔接，在过去几年里是个特别热门的话题，但是我们一直在找那个突破点到底在哪里。我觉得这一次大模型人工智能技术的不断成熟，让我们看到突变时刻可能到来了。

整个市场的变化是从2022年11月30号开始的。3月份我觉得百度这一次抓到了第一张船票。文心一言已经推出了，但是我觉得它还处在一个很模糊的阶段。

沈抖：整个行业都处在学习的过程中。

吴晓波：你在演讲的时候，我在下面很认真地听，我觉得百度在大模型这块，第一起了个大早，第二我觉得很多基础性的事情你们是想明白了的。过去一年多，百度智能云到底发生了什么变化？

沈抖：其实是从国内的大模型兴起到现在，我觉得很明显的一个变化，从原来那种尝鲜、体验，变成真正要把这个大模型用到实际的生产环境里去了。

我觉得总结来讲，第一，过去一年大模型本身的能力还是有明显提升的。在百度，我们也是从原来的文心3.5到4.0，再到4.0的Turbo，因为整个模型本身的能力还在持续地提升的过程中。第二个就是中国的大模型从第一天开始就特别追求它的应用效果。我记得李总（李彦宏）曾经说过一次，就是没有应用的大模型一文不值，就是强调大模型的应用价值。其实在百度内部很早就开始要求基于AI重构所有产品。

用大模型“串”起创新的“珍珠”

吴晓波：其实你今天上午演讲中我有个印象很深，你说一个人他去旅行，就要安排一站式的旅行。

这里面涉及百度原来所形成的很多能力，比如自然语言输入模型、搜索能力、百度地图、导航能力。是不是大模型它现在有点像一串珍珠里面那根线，把原来的点状的创新给它串起来了？

沈抖：人工智能发展了几十年了，在这个过程中确实是积累了大量的单点能力，只不过是缺少一个东西，怎么能把它给串起来。

大模型有非常强大的理解、生成、推理、记忆能力。原来看是比眼睛，听是比耳朵，现在大模型更像是跟人的大脑比，就是因为它有了这种理解规划，甚至是执行的这种能力。所以你刚才讲的那个，怎么能帮助旅行者规划旅游线路，有了大模型以后，通过Agent（智能体）这种工具调用的能力，它就会把这些东西给串起来，所以我觉得这个是比以前要好很多的。

吴晓波：3月份文心一言推出以后，从数据来看，百度在整个中国大模型市场里已处于非常领先的地步，中国央企一半以上都在使用这个大模型。

吴晓波：我觉得电网跟你们还合作的蛮深的。

百度智能云员工：能源制造行业落地了蛮多的央国企，像南方电网、华润集团，还有中石化集团。主要就是集中在我们大模型的一些行业应用，目前我们其实是已经有超过60%的央企都是在使用我们百度智能云平台的大模型。

沈抖：对，我觉得这是因为大的央企它的场景是非常丰富的，它可以从比较深的制造环节到知识管理环节，到客户运营、客服环节整个线拉得比较长，总能找到这些应用的场景。比如龙源电力风机设备的维护和检修全部可以做到智能化。

吴晓波：其实他们都已经在过去的五六年，比如说像传感器还有视觉系统，他们对数据的挖掘基本上已经完成了，但其实这些年一直没有整合。

沈抖：他就是把以前各种感官的数据，通过大模型这个大脑把它有机地整合起来。

吴晓波：对对对，就形成了大脑系统。

沈抖：我觉得在这个过程中可能对百度来讲，第一这些东西不是一蹴而就的，确实需要长时间的积累，那你想做好这个大模型，无非就是算力、数据、算法这三个东西。

第二个就是去年3月份发布的文心一言，实际上我们是当时所有互联网大厂里面第一家推出类似ChatGPT这种对话能力的大语言模型产品，所以很大程度上也给国内的企业带来了信心，同时也打开了国内很多企业的认知窗口，所以我觉得这种先发优势其实现在看起来影响还是很大的。

第三也是很重要的一个，就是刚才讲到百度特别强调自己产品的AI重构，怎么能用大模型把所有的产品重新做一遍。其实现在大模型它也没有到万能的地步，应用起来可能有百分之六七十的准确率，那么在这种场景下怎么优化，让它达到百分之八九十甚至以上，这其实都是需要有一个过程的，积累之后我们再去跟客户讲，客户一听就知道你干了还是没干，使得客户对百度更有信心。

正是因为这些原因，才有您刚才说的那个为什么这么多的央企，还有很多互联网企业，包括教育、电商、制造业、基础设施、供应商都已经和我们开展合作。

吴晓波：看我们这个节目的人很多是各行各业的。比如一年多以来，你在跟一线的企业接触过程中，哪一些行业对大模型、人工智能最为敏感，他们会第一批拥抱这个行业呢？

沈抖：从对大模型的兴趣来讲，我觉得现在是全民都有兴趣。但是从落地进展来看，我们发现它也是一个多点开花的局面。

在一些能源制造、交通政府这些领域，为什么也能用上大模型呢？是因为它其实有大量的知识管理需求，需要助手的地方，你说哪个企业不需要智能客服，哪个企业不需要有文案工作？大模型在这些领域肯定是非常容易，而且能取得很好效果。今天大家对大模型应用的理解，以及推动大模型落地的决心，比一年以前绝对是大了很多。

谁需要？谁拥抱？

吴晓波：他介绍你很惊艳，讲到你生数这块。

朱军：可以稍微介绍一下，我们叫Vidu大模型，视频大模型。我们单个模型最长32秒，现在放出来给大家用的是4秒和8秒，创作者还可以用Vidu大模型生成几个片段以后把它串起来做一个作品。

吴晓波：那我请教一下，比如像他这个猫，这个人物它是文字生成的吗？还是有一张照片要输进去？

朱军：我们几种功能都支持，就用户可以通过文字生成视频，还可以通过单张照片输入作为起始帧，它支持写实风格、动画风格，这里面最主要的还是主体一致性的保持。

吴晓波：如果生成个30秒的一个成片，要多少时间？要多少成本？

朱军：现在行业最快的就是30秒以内可以生成4秒的片段，当然我们现在也有模型，未来会推出来更长的，优化空间更大。

沈抖：我觉得将来需求量会越来越大，现在做视频创作的人有多大的群体，他们如果用这个东西至少来辅助生成都会很好。

吴晓波：很厉害，看着你们每天进步，特别好。

沈抖：是，他们进步还是很快的，你看成立也就一年多的时间，然后这个产品上线，而且有几百万人已经试用过了，我觉得进化的速度非常快。

吴晓波：都你的车，是吧？

夏一平：这是我们的车，刚刚上线的，9月12日刚开发布会。

沈抖：你跟吴老师讲讲。

夏一平：我们一直把自己定位成一个汽车机器人的概念，其实里面把大量百度在过去十年积累的AI能力和大模型在里面原生植入。其实在车内就有文心一言，包括我们现在车上的多模态语音识别，都是百度的AI成果，包括连续语音这个自然语义识别，基本上你可以随意提问。你看我们车上几乎没有物理按键，是因为我们对语音识别，包括我们模型这些能力足够有信心，我们平均每个用户每天跟车要交互47次。

沈抖：47次，当朋友聊天了。

夏一平：这个是我们新开发的一个，就是把说明书跟文心一言打通。

沈抖：你看就是这个智能客服。

夏一平：就是不需要再有纸质说明书了。

沈抖：我以前其实最发愁的就是看车的说明书，那厚厚一本。

夏一平：其实智能车最大的不一样，是我们从去年10月27号上线到现在，几乎每到一两个月就会迭代一个新的软件。

沈抖：这就是跟以往传统车厂不一样的地方。

夏一平：而且每一次迭代不是说只更新8个功能，我们从1.7到2.0的版本，就更新了957个功能。

吴晓波：一年前大家去生一张图，然后用文心一言去弄一段文字，大家都很新奇。但现在大家可能不讨论这个事了，它不再是新闻了，但它实际上已经变成了你的工作中的一部分。

沈抖：你说得非常对，我觉得它已经渗透到了研产供销服的各个环节，只不过是以这种润物细无声的方式切进去的。

比如刚才咱体验极越车的时候，他演示了一下问怎么能把车斗打开，或者是放在哪之类的，这种原来都是需要一本厚厚的汽车说明书，现在你只需跟他对话，这就是所谓典型的rag应用。就是你把这些知识作为一个知识库挂在大模型上，然后大模型在回答问题的时候结合这个知识库就能够回答问题了，你说这种应用其实我们很多时候将来就意识不到这背后是大模型在工作了。

吴晓波：其实，我今天陪你看的两个企业还是挺让我惊艳的，一个是生数，第二是极越。

你会看到他们两家，一个是在短视频的生成方面，一个是在智能驾舱的体验部分，他们两个跟百度都有很深的合作。在合作的过程中，这些企业、科技企业或者制造企业和百度，在过去一年里所形成的这种技术衔接是怎么达成的？

沈抖：对，这个是个很好的问题，我觉得这也是大模型跟以往这些技术不一样的地方。大模型它有比较强的通用性和泛化的能力，它实际上形成了一个很厚的底座，这也是为什么今天上午我们讲大模型也好，相关的人工智能技术也好，实际上都是一个新的基础设施。

也正是因为这个原因，比如我们跟生数的合作，他训练模型和推理模型需要大规模的GPU集群，那我来给他提供这个算力支持，这些API调用的这个能力，通过千帆就能提供给更多的用户来用。跟极越合作就更平滑了，因为它这场景很多，你看刚才里面演示的那些各种各样的场景。

吴晓波：有些其实挺难的，你在几年前蛮难做的。

沈抖：我觉得想都不用想，这次大模型它最厉害的地方就是突破了一个临界点。我们还可以说它有很多不足的地方，但是它至少是过了及格线，一旦过了这个及格线以后在上面能折腾的事就变多了。所以虽然极越有个别的问题，可能因为噪音的问题，回答得不是那么流畅，但是我觉得这些问题就像那个刚才Joe说的，它一个版本升级可能就改了九十几个功能，那他就迭代呗，速度就会快一些。

吴晓波：您的观察我觉得特别同意，你讲得特别关键点的就是那个临界点过了，行业有可能发生突变。

未来：基础设施之后

吴晓波：我觉得讲到特别重要的观点就是，基础设施的厚度、通用性变得特别强，所以这是不是意味着像百度智能云这样的企业未来在各个行业大模型的整个推广和发展过程中，作为基础设施供应商所要承担的角色会越来越重？

所以我要请教你，在过去一年多里面，你们在大模型的基础设施这部分做了哪些投入？另外面向未来，可能也就万级要到10万级甚至更高级别，你们做了哪些准备？

沈抖：我觉得还是要把这分成几层，我们一直在讲的就是百度是认为人工智能分成四层，即芯片、框架、模型和应用。

那在这个芯片上就得面临国内的这种特殊的情况，一家企业可能有好几种芯片，那我们就得做一云多芯，然后把大家这些芯片都管理好。其实我们不只是说把算力卖给你，很多时候是一些企业他自己整好了算力，他把GPU都买好了放在那，他说百度，你把你的百舸系统布到我这，帮我把这些管起来。

吴晓波：他自己有GPU，还用百舸？

沈抖：他有了GPU以后用不起来，其实没什么意义。怎么能让它组成一个高效的网络，怎么让它高效运作，如果出错了以后怎么去容错，这一层的管理，也是百度交了很多学费学出来的，模型的话我们也特别强调是要跟场景去match、去吻合。

再往上我认为也是很重要的一部分，就是怎么去帮助企业做应用开发。那么这些做完之后，它所产生的价值在哪呢？在于你把应用搭出来了，用户去用了他就会发现问题，发现问题以后他就会反馈问题，反馈问题以后我们就会提高这个平台的能力。对于一个客户来讲，他微调了自己的模型，搭了自己的应用，收集了数据，微调模型再去优化应用，它就会形成一个飞轮。

它既可以是一个定制的模型和应用之间的这个小飞轮，也可以是我们刚才讲的，整个这一套系统的一个大飞轮，飞轮转得越久越快，那它每一层的能力就会越强，所以我觉得这就是百度在过去一段时间，为整个这个智能时代做的基础设施上的工作。

吴晓波：你觉得现在如果几十万、上百万的原生应用模型不断诞生，对你一个基础设施来讲的话，算力方面会带来多大的挑战？

沈抖：算力我认为肯定持续是一个有挑战的事情。芯片不够的时候，是算力不足，芯片够的时候你还得考虑效率问题，怎么能让效率充分利用，我觉得这是一个需要持续在这个方向上去优化的事。我觉得刚才您提到的那个问题，就是对百度来讲，这么大的应用爆发会带来怎样的挑战，这要从两面来看这个问题。

第一，我们刚才讲百度是做了很多基础设施，我们希望这样的应用尽快地爆发，如果爆发了，这些应用真做起来了，反过来我觉得会让这个平台的效率更高，效果更好。所以刚才您问了一个很好的问题，就是说这么多行业，这么多企业，百度通用的模型能不能去适配更多？

这也是我今天上午说那个概念，就是所谓行业增强版的千帆，我认为在每一个行业里面从头去做一个大模型，从头去做一套工具链，我认为没必要。

原因还是回到刚才说的，大模型它有相当强的通用性，但与此同时，大模型还有另外一个优势，就是你可以在上面不断地叠加，当给定一个模型以后，你不断地给它数据，它就会不断地变好。

站在这种巨人的肩膀之上，然后去做这种行业增强，不断往里面灌行业的数据、行业的知识，行业的流程，做出专门的行业组件。这时候当基线大模型变好的时候，那你很多工作在上面，就是redo一下或者refresh一下就OK了。

所以我觉得在这种情况下，这个底座很宽很厚，然后将来各个行业用起来就会更方便，这也是为什么这次大模型和以往那些人工智能，和以往那些单点智能完全不一样。

吴晓波：所以我觉得到2025年，可能我们今天在大会上看到的很多这些先行者，他们在行业里的实验，在各行各业会被引爆掉。所以明年可能我觉得行业大模型会到一个元年时刻。

互联网有个可以说是很好的事情，也是一件很让人挠头的事情，就是环境通吃，这一次人工智能对各行各业的渗透，会产生新的垄断者和出现环境通吃的情况吗？

沈抖：对，这是个很好的问题，我们也一直在思考这个问题。因为首先大模型还在发展，非常早期，我觉得现在很多都是对未来的一个猜想。

所以我的想法是这样的，一个有价值的行业里面，肯定不会遍地开花，它将来一定是少数企业在做这个基础设施的建设，这不只是在互联网上，在其他行业也是。回到大模型这件事，我的判断是这样，基座模型、工具链，包括底层的算力支持，确实不需要太多企业重复建设。

但是围绕大模型的生态，绝对不只是几个基座模型就解决的问题，虽然我们刚才讲在各行各业各个场景里面，大模型有很强的通用性，但是我们还是要做一些行业增强。

吴晓波：最后一个问题，你觉得中国和美国，在人工智能赛道里面，会产生怎样的相同性和相异性？

沈抖：我觉得中国最大的特点就是应用场景多，应用驱动。在互联网时代、大模型时代肯定也是这样，虽然大模型本身早期的时候是非常技术驱动型的事情，但是我觉得刚才说的已经过了一定的门槛，过了拐点，接下来应用对整个模型的驱动会变得非常大。

如果就是为了追求技术，做了一个很好的模型，然后一代一代地迭代，最后没有应用，它跑不了多远。反倒是如果形成了一个完整的商业模式，这个飞轮转起来以后我觉得更健康、更可持续。所以从这个角度来讲，我觉得中国这么丰富的应用场景，对大模型以及周边系统的发展，会是一个很大的工作。

吴晓波：其实我们今天跟沈抖博士在一起讨论大模型的时候，可能跟去年的三四月份相比没有那么热烈，没有那么多的想象力，但是你会发觉现在变得非常理性，非常真实。我们今天在百度云智大会上已经看到了很多实际渗透到一个港口、一辆汽车、一个考试软件，甚至到一个搜索系统所带来的一些变化。我相信这些变化会越来越多，可能会成千上万的出现，然后引爆一个新的人工智能在中国的应用的一个热潮，我觉得这也是我们对这个行业，每个人都在被革命和成为一个革命的一个过程，所以特别期待明年这个时候再在百度云智大会上看到一些新的变革。

沈抖：对，一定会有不一样的东西，一定会比今天更加繁荣。