中国大模型应用优势解析：技术叠加特性如何助力发展？

本文链接：https://blog.csdn.net/python1222_/article/details/138862140

在底层竞争上，中国的能力还有待提升。只要把握住应用的这个关键，尊重科技的市场规律，突破就是水到渠成的事。如果一味实施全面赶超战略，反而可能欲速则不达。

9月7日，腾讯混元大模型在2023腾讯全球数字生态大会上正式对外亮相。这是国内大模型赛道上的又一个新玩家。此前360公布了智脑大模型、科大讯飞公布了星火认知大模、阿里公布了通义千问，百度文心一言落地。“百模大战”已经转向了“百模应用之争”。

大模型可以生产、生活的效率，并创造出新的市场模式，还有潜力成为改变人类历史的关键科技突破。是新型基础设施的关键底座之一，从这个意义上，大模型的竞争也是国家科技战略的竞争。

大模型，某种程度上，是技术的叠加，即在既有科技条件下，通过重复、叠加、数量提升，由量变到质变，实现更高的技术效果。

在科幻小说《三体》中，就提到一种技术暴力叠加的产品，诸葛连弩，即利用皮筋作为动力的连发弓箭，从而达到机枪的作用。还提到了人列计算机，即人通过翻转手中的牌子模拟01两种状态，从而模仿计算机。

对于大模型而言，就是通过算力的叠加，最终，涌现出智能。这里的涌现二字，是一个专有名词。在哲学、系统论、科学和艺术中，当一个实体被观察到具有其所有组成部分本身没有的属性时，就称为涌现（ emergence）。这些属性或行为，只有当各个部分在一个更广泛的整体中相互作用时才会涌现。最简单的，当一辆自行车和骑手互动时，平稳地向前运动就出现了，但是两个部分都不能独自产生这种行为。更复杂的，生物是由化学反应组成的，但高于化学反应，是化学反应中涌现的。自我意识，是从生物的神经生物学现象中涌现出的。

芯片处理能力提升、硬件价格下降、神经网络模型优化，推动算力大幅提升。目前，同等算法水平所需的计算量每8个月减半，成本降低至不到 1%，摩尔定律效应明显。这是技术叠加的硬件基础。OpenAl计划在工程上进行大量投入，在建立基于1000万张GPU卡的超级大模型。而现在英伟达2023年GPU的产量仅为165万张，当然，随着需求上升，产量是可以扩张的。

这种技术的叠加的本质，使得大模型在技术上、商业上，都呈现出自己独有的特征。

首先，大模型的发展要依靠大企业，巨头是大模型的天然玩家。

OpenAI仅运行其人工智能服务ChatGPT每天就要花费约70万美元，其亏损额在5月份翻了一番，达到了5.4亿美元。这对中小公司来说，这当然是一个很大的数字。但这对巨头不算什么。微软投资的100亿，足以支撑其运行37年。如果以美国当下的高利率来计算，连利息都花不完。

某种程度上，这也是技术发展的一般特征。以前cpu都是众多厂家做，到了现在，只有巨头才能承担研发的成本了。有人预测，再往后要国家之力了，intel这样的跨国公司，其实就是全球之力了，通过市场聚集的全球之力。

中国有超大体量的市场规模。超大市场规模，很重要的一个特征，就是中国有大型公司。中美是时间上仅有的两个单一大规模市场国家，都有全球性的大公司。

与持续地高成本投入相对应的，是商业上的长期主义。大模型的市场发展，不是赶集，而是马拉松。大型公司的特征就是，注重长期目标，不赚小钱，擅长的不是短跑而是长跑。对于这一点，马化腾曾表示“对于工业革命来讲，早一个月把电灯泡拿出来，在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好”。在使用场景资源，数据优势的助推下，持续的“市场应用－发展”，将徐徐展开。

其次，技术叠加的特征，在商业上，就使得中国公司的逼近更加容易。

随着信息技术的发展，技术扩散的速度在变快，深度在变大。具有叠加特征的技术，更容易扩散。从OpenAI闯通大模型这条道路，到中国跟上，只有半年时间。一方面，这是因为技术扩散一直在持续地进行，公众觉得很新鲜，闻所未闻的技术领域，对于具有国际视野的国内同行业来说，都是有关注、并有一定跟随的。

既然是叠加，方向清楚了，投入资源去做，这恰好是中国擅长的。超算也是一种技术的暴力叠加。最近英特尔宣布完成世界第一超算“Aurora”，就由63744颗CPU处理器组成。基于这种叠加性，中国虽然在单个超级计算机中，暂时无法位列前五，但根据榜单显示，全球浮点运算性能最强的500台超级计算机中，中国部署的超级计算机数量位列全球第一（173台），占总体份额的34.6％。

第三，大模型，其实最难的是应用上的落地和创新，这也是中国擅长的。

大模型很重要的一个特征是，应用和技术的双轮驱动。一般而言，技术和应用是通过利润形成一个循环的。研发、开发新产品、高利润、然后再次投入研发。人工智能的发展也符合这个循环的规律。

而且，在这个循环之外，应用本身就促使人工智能的发展。打个比方，一个消费者再怎么高强度地使用一块CPU，不会对intel公司的研发产生影响，消费者仅仅只能贡献利润，购买的时候就完成了。但人工智能不一样的地方就在于，消费者使用得越多，人工智能就能获得更多的数据，更多的回馈，从而提升神经网络的能力。所以，AI大模型的发展，重应用、重解决实际问题。

在应用方面，中国的优势在于超大市场规模，场景丰富，市场规模大，反应及时，有很强的产品创新能力，有着自己独特的优势，有些方面已经领先美国。

大模型需要落到满足市场的实际需求，面向企业和个人的真实需求，这个时候场景特别重要。更多的场景，更多地解决真实需求，突出实用性，利于进行技术和需求匹配，就更能取得更好的效果，带动更快的技术发展。以腾讯为例，目前，腾讯混元大模型已经在腾讯云、腾讯广告、腾讯会议、腾讯文档、微信搜一搜、腾讯游戏等50个业务和产品接入测试。腾讯混元还将作为腾讯云MaaS（大模型即服务）服务的底座，通过API为不同产业场景构建专属应用。务实地以这些应用为基础，满足用户需求，坚持长跑，并在长跑中变得更加健壮，是中国大模型必然的发展逻辑。

当然，也应该清晰的认识到，中国也有自己的薄弱环节。meta的开源大模型LLaMA家族，性价比很高，正在成为主流开源模型，但目前从效果上看还是GPT效果要好很多。GPT3.0之后不再开源，其他大模型何时可以达到GPT的效果还是未知。在这种底层竞争上，中国的能力还有待提升。但是，只要把握住应用的这个关键，尊重科技的市场规律，不断持续从市场应用中获得利润、技术积累、人才积累，突破就是水到渠成的事。如果一味实施全面赶超战略，反而可能欲速则不达。