技术叠加特性之下的中国大模型应用优势-CSDN博客

本文链接：https://blog.csdn.net/python122_/article/details/138486016

在底层竞争上，中国的能力还有待提升。只要把握住应用的这个关键，尊重科技的市场规律，突破就是水到渠成的事。如果一味实施全面赶超战略，反而可能欲速则不达。

9月7日，腾讯混元大模型在2023腾讯全球数字生态大会上正式对外亮相。这是国内大模型赛道上的又一个新玩家。此前360公布了智脑大模型、科大讯飞公布了星火认知大模、阿里公布了通义千问，百度文心一言落地。“百模大战”已经转向了“百模应用之争”。

大模型可以生产、生活的效率，并创造出新的市场模式，还有潜力成为改变人类历史的关键科技突破。是新型基础设施的关键底座之一，从这个意义上，大模型的竞争也是国家科技战略的竞争。

大模型，某种程度上，是技术的叠加，即在既有科技条件下，通过重复、叠加、数量提升，由量变到质变，实现更高的技术效果。

在科幻小说《三体》中，就提到一种技术暴力叠加的产品，诸葛连弩，即利用皮筋作为动力的连发弓箭，从而达到机枪的作用。还提到了人列计算机，即人通过翻转手中的牌子模拟01两种状态，从而模仿计算机。

对于大模型而言，就是通过算力的叠加，最终，涌现出智能。这里的涌现二字，是一个专有名词。在哲学、系统论、科学和艺术中，当一个实体被观察到具有其所有组成部分本身没有的属性时，就称为涌现（ emergence）。这些属性或行为，只有当各个部分在一个更广泛的整体中相互作用时才会涌现。最简单的，当一辆自行车和骑手互动时，平稳地向前运动就出现了，但是两个部分都不能独自产生这种行为。更复杂的，生物是由化学反应组成的，但高于化学反应，是化学反应中涌现的。自我意识，是从生物的神经生物学现象中涌现出的。

芯片处理能力提升、硬件价格下降、神经网络模型优化，推动算力大幅提升。目前，同等算法水平所需的计算量每8个月减半，成本降低至不到 1%，摩尔定律效应明显。这是技术叠加的硬件基础。OpenAl计划在工程上进行大量投入，在建立基于1000万张GPU卡的超级大模型。而现在英伟达2023年GPU的产量仅为165万张，当然，随着需求上升，产量是可以扩张的。

这种技术的叠加的本质，使得大模型在技术上、商业上，都呈现出自己独有的特征。

首先，大模型的发展要依靠大企业，巨头是大模型的天然玩家。

OpenAI仅运行其人工智能服务ChatGPT每天就要花费约70万美元，其亏损额在5月份翻了一番，达到了5.4亿美元。这对中小公司来说，这当然是一个很大的数字。但这对巨头不算什么。微软投资的100亿，足以支撑其运行37年。如果以美国当下的高利率来计算，连利息都花不完。

某种程度上，这也是技术发展的一般特征。以前cpu都是众多厂家做，到了现在，只有巨头才能承担研发的成本了。有人预测，再往后要国家之力了，intel这样的跨国公司，其实就是全球之力了，通过市场聚集的全球之力。

中国有超大体量的市场规模。超大市场规模，很重要的一个特征，就是中国有大型公司。中美是时间上仅有的两个单一大规模市场国家，都有全球性的大公司。

与持续地高成本投入相对应的，是商业上的长期主义。大模型的市场发展，不是赶集，而是马拉松。大型公司的特征就是，注重长期目标，不赚小钱，擅长的不是短跑而是长跑。对于这一点，马化腾曾表示“对于工业革命来讲，早一个月把电灯泡拿出来，在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好”。在使用场景资源，数据优势的助推下，持续的“市场应用－发展”，将徐徐展开。

其次，技术叠加的特征，在商业上，就使得中国公司的逼近更加容易。

随着信息技术的发展，技术扩散的速度在变快，深度在变大。具有叠加特征的技术，更容易扩散。从OpenAI闯通大模型这条道路，到中国跟上，只有半年时间。一方面，这是因为技术扩散一直在持续地进行，公众觉得很新鲜，闻所未闻的技术领域，对于具有国际视野的国内同行业来说，都是有关注、并有一定跟随的。

既然是叠加，方向清楚了，投入资源去做，这恰好是中国擅长的。超算也是一种技术的暴力叠加。最近英特尔宣布完成世界第一超算“Aurora”，就由63744颗CPU处理器组成。基于这种叠加性，中国虽然在单个超级计算机中，暂时无法位列前五，但根据榜单显示，全球浮点运算性能最强的500台超级计算机中，中国部署的超级计算机数量位列全球第一（173台），占总体份额的34.6％。

第三，大模型，其实最难的是应用上的落地和创新，这也是中国擅长的。

大模型很重要的一个特征是，应用和技术的双轮驱动。一般而言，技术和应用是通过利润形成一个循环的。研发、开发新产品、高利润、然后再次投入研发。人工智能的发展也符合这个循环的规律。

而且，在这个循环之外，应用本身就促使人工智能的发展。打个比方，一个消费者再怎么高强度地使用一块CPU，不会对intel公司的研发产生影响，消费者仅仅只能贡献利润，购买的时候就完成了。但人工智能不一样的地方就在于，消费者使用得越多，人工智能就能获得更多的数据，更多的回馈，从而提升神经网络的能力。所以，AI大模型的发展，重应用、重解决实际问题。

在应用方面，中国的优势在于超大市场规模，场景丰富，市场规模大，反应及时，有很强的产品创新能力，有着自己独特的优势，有些方面已经领先美国。

大模型需要落到满足市场的实际需求，面向企业和个人的真实需求，这个时候场景特别重要。更多的场景，更多地解决真实需求，突出实用性，利于进行技术和需求匹配，就更能取得更好的效果，带动更快的技术发展。以腾讯为例，目前，腾讯混元大模型已经在腾讯云、腾讯广告、腾讯会议、腾讯文档、微信搜一搜、腾讯游戏等50个业务和产品接入测试。腾讯混元还将作为腾讯云MaaS（大模型即服务）服务的底座，通过API为不同产业场景构建专属应用。务实地以这些应用为基础，满足用户需求，坚持长跑，并在长跑中变得更加健壮，是中国大模型必然的发展逻辑。

当然，也应该清晰的认识到，中国也有自己的薄弱环节。meta的开源大模型LLaMA家族，性价比很高，正在成为主流开源模型，但目前从效果上看还是GPT效果要好很多。GPT3.0之后不再开源，其他大模型何时可以达到GPT的效果还是未知。在这种底层竞争上，中国的能力还有待提升。但是，只要把握住应用的这个关键，尊重科技的市场规律，不断持续从市场应用中获得利润、技术积累、人才积累，突破就是水到渠成的事。如果一味实施全面赶超战略，反而可能欲速则不达。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述