中国大模型应用优势解析:技术叠加特性如何助力发展?

在底层竞争上,中国的能力还有待提升。只要把握住应用的这个关键,尊重科技的市场规律,突破就是水到渠成的事。如果一味实施全面赶超战略,反而可能欲速则不达。

9月7日,腾讯混元大模型在2023腾讯全球数字生态大会上正式对外亮相。这是国内大模型赛道上的又一个新玩家。此前360公布了智脑大模型、科大讯飞公布了星火认知大模、阿里公布了通义千问,百度文心一言落地。“百模大战”已经转向了“百模应用之争”。

大模型可以生产、生活的效率,并创造出新的市场模式,还有潜力成为改变人类历史的关键科技突破。是新型基础设施的关键底座之一,从这个意义上,大模型的竞争也是国家科技战略的竞争。

大模型,某种程度上,是技术的叠加,即在既有科技条件下,通过重复、叠加、数量提升,由量变到质变,实现更高的技术效果。

在科幻小说《三体》中,就提到一种技术暴力叠加的产品,诸葛连弩,即利用皮筋作为动力的连发弓箭,从而达到机枪的作用。还提到了人列计算机,即人通过翻转手中的牌子模拟01两种状态,从而模仿计算机。

对于大模型而言,就是通过算力的叠加,最终,涌现出智能。这里的涌现二字,是一个专有名词。在哲学、系统论、科学和艺术中,当一个实体被观察到具有其所有组成部分本身没有的属性时,就称为涌现( emergence)。这些属性或行为,只有当各个部分在一个更广泛的整体中相互作用时才会涌现。最简单的,当一辆自行车和骑手互动时,平稳地向前运动就出现了,但是两个部分都不能独自产生这种行为。更复杂的,生物是由化学反应组成的,但高于化学反应,是化学反应中涌现的。自我意识,是从生物的神经生物学现象中涌现出的。

芯片处理能力提升、硬件价格下降、神经网络模型优化,推动算力大幅提升。目前,同等算法水平所需的计算量每8个月减半,成本降低至不到 1%,摩尔定律效应明显。这是技术叠加的硬件基础。OpenAl计划在工程上进行大量投入,在建立基于1000万张GPU卡的超级大模型。而现在英伟达2023年GPU的产量仅为165万张,当然,随着需求上升,产量是可以扩张的。

这种技术的叠加的本质,使得大模型在技术上、商业上,都呈现出自己独有的特征。

首先,大模型的发展要依靠大企业,巨头是大模型的天然玩家。

OpenAI仅运行其人工智能服务ChatGPT每天就要花费约70万美元,其亏损额在5月份翻了一番,达到了5.4亿美元。这对中小公司来说,这当然是一个很大的数字。但这对巨头不算什么。微软投资的100亿,足以支撑其运行37年。如果以美国当下的高利率来计算,连利息都花不完。

某种程度上,这也是技术发展的一般特征。以前cpu都是众多厂家做,到了现在,只有巨头才能承担研发的成本了。有人预测,再往后要国家之力了,intel这样的跨国公司,其实就是全球之力了,通过市场聚集的全球之力。

中国有超大体量的市场规模。超大市场规模,很重要的一个特征,就是中国有大型公司。中美是时间上仅有的两个单一大规模市场国家,都有全球性的大公司。

与持续地高成本投入相对应的,是商业上的长期主义。大模型的市场发展,不是赶集,而是马拉松。大型公司的特征就是,注重长期目标,不赚小钱,擅长的不是短跑而是长跑。对于这一点,马化腾曾表示“对于工业革命来讲,早一个月把电灯泡拿出来,在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好”。在使用场景资源,数据优势的助推下,持续的“市场应用-发展”,将徐徐展开。

其次,技术叠加的特征,在商业上,就使得中国公司的逼近更加容易。

随着信息技术的发展,技术扩散的速度在变快,深度在变大。具有叠加特征的技术,更容易扩散。从OpenAI闯通大模型这条道路,到中国跟上,只有半年时间。一方面,这是因为技术扩散一直在持续地进行,公众觉得很新鲜,闻所未闻的技术领域,对于具有国际视野的国内同行业来说,都是有关注、并有一定跟随的。

既然是叠加,方向清楚了,投入资源去做,这恰好是中国擅长的。超算也是一种技术的暴力叠加。最近英特尔宣布完成世界第一超算“Aurora”,就由63744颗CPU处理器组成。基于这种叠加性,中国虽然在单个超级计算机中,暂时无法位列前五,但根据榜单显示,全球浮点运算性能最强的500台超级计算机中,中国部署的超级计算机数量位列全球第一(173台),占总体份额的34.6%。

第三,大模型,其实最难的是应用上的落地和创新,这也是中国擅长的。

大模型很重要的一个特征是,应用和技术的双轮驱动。一般而言,技术和应用是通过利润形成一个循环的。研发、开发新产品、高利润、然后再次投入研发。人工智能的发展也符合这个循环的规律。

而且,在这个循环之外,应用本身就促使人工智能的发展。打个比方,一个消费者再怎么高强度地使用一块CPU,不会对intel公司的研发产生影响,消费者仅仅只能贡献利润,购买的时候就完成了。但人工智能不一样的地方就在于,消费者使用得越多,人工智能就能获得更多的数据,更多的回馈,从而提升神经网络的能力。所以,AI大模型的发展,重应用、重解决实际问题。

在应用方面,中国的优势在于超大市场规模,场景丰富,市场规模大,反应及时,有很强的产品创新能力,有着自己独特的优势,有些方面已经领先美国。

大模型需要落到满足市场的实际需求,面向企业和个人的真实需求,这个时候场景特别重要。更多的场景,更多地解决真实需求,突出实用性,利于进行技术和需求匹配,就更能取得更好的效果,带动更快的技术发展。以腾讯为例,目前,腾讯混元大模型已经在腾讯云、腾讯广告、腾讯会议、腾讯文档、微信搜一搜、腾讯游戏等50个业务和产品接入测试。腾讯混元还将作为腾讯云MaaS(大模型即服务)服务的底座,通过API为不同产业场景构建专属应用。务实地以这些应用为基础,满足用户需求,坚持长跑,并在长跑中变得更加健壮,是中国大模型必然的发展逻辑。

当然,也应该清晰的认识到,中国也有自己的薄弱环节。meta的开源大模型LLaMA家族,性价比很高,正在成为主流开源模型,但目前从效果上看还是GPT效果要好很多。GPT3.0之后不再开源,其他大模型何时可以达到GPT的效果还是未知。在这种底层竞争上,中国的能力还有待提升。但是,只要把握住应用的这个关键,尊重科技的市场规律,不断持续从市场应用中获得利润、技术积累、人才积累,突破就是水到渠成的事。如果一味实施全面赶超战略,反而可能欲速则不达。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值