技术叠加特性之下的中国大模型应用优势

在底层竞争上,中国的能力还有待提升。只要把握住应用的这个关键,尊重科技的市场规律,突破就是水到渠成的事。如果一味实施全面赶超战略,反而可能欲速则不达。

9月7日,腾讯混元大模型在2023腾讯全球数字生态大会上正式对外亮相。这是国内大模型赛道上的又一个新玩家。此前360公布了智脑大模型、科大讯飞公布了星火认知大模、阿里公布了通义千问,百度文心一言落地。“百模大战”已经转向了“百模应用之争”。

大模型可以生产、生活的效率,并创造出新的市场模式,还有潜力成为改变人类历史的关键科技突破。是新型基础设施的关键底座之一,从这个意义上,大模型的竞争也是国家科技战略的竞争。

大模型,某种程度上,是技术的叠加,即在既有科技条件下,通过重复、叠加、数量提升,由量变到质变,实现更高的技术效果。

在科幻小说《三体》中,就提到一种技术暴力叠加的产品,诸葛连弩,即利用皮筋作为动力的连发弓箭,从而达到机枪的作用。还提到了人列计算机,即人通过翻转手中的牌子模拟01两种状态,从而模仿计算机。

对于大模型而言,就是通过算力的叠加,最终,涌现出智能。这里的涌现二字,是一个专有名词。在哲学、系统论、科学和艺术中,当一个实体被观察到具有其所有组成部分本身没有的属性时,就称为涌现( emergence)。这些属性或行为,只有当各个部分在一个更广泛的整体中相互作用时才会涌现。最简单的,当一辆自行车和骑手互动时,平稳地向前运动就出现了,但是两个部分都不能独自产生这种行为。更复杂的,生物是由化学反应组成的,但高于化学反应,是化学反应中涌现的。自我意识,是从生物的神经生物学现象中涌现出的。

芯片处理能力提升、硬件价格下降、神经网络模型优化,推动算力大幅提升。目前,同等算法水平所需的计算量每8个月减半,成本降低至不到 1%,摩尔定律效应明显。这是技术叠加的硬件基础。OpenAl计划在工程上进行大量投入,在建立基于1000万张GPU卡的超级大模型。而现在英伟达2023年GPU的产量仅为165万张,当然,随着需求上升,产量是可以扩张的。

这种技术的叠加的本质,使得大模型在技术上、商业上,都呈现出自己独有的特征。

首先,大模型的发展要依靠大企业,巨头是大模型的天然玩家。

OpenAI仅运行其人工智能服务ChatGPT每天就要花费约70万美元,其亏损额在5月份翻了一番,达到了5.4亿美元。这对中小公司来说,这当然是一个很大的数字。但这对巨头不算什么。微软投资的100亿,足以支撑其运行37年。如果以美国当下的高利率来计算,连利息都花不完。

某种程度上,这也是技术发展的一般特征。以前cpu都是众多厂家做,到了现在,只有巨头才能承担研发的成本了。有人预测,再往后要国家之力了,intel这样的跨国公司,其实就是全球之力了,通过市场聚集的全球之力。

中国有超大体量的市场规模。超大市场规模,很重要的一个特征,就是中国有大型公司。中美是时间上仅有的两个单一大规模市场国家,都有全球性的大公司。

与持续地高成本投入相对应的,是商业上的长期主义。大模型的市场发展,不是赶集,而是马拉松。大型公司的特征就是,注重长期目标,不赚小钱,擅长的不是短跑而是长跑。对于这一点,马化腾曾表示“对于工业革命来讲,早一个月把电灯泡拿出来,在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好”。在使用场景资源,数据优势的助推下,持续的“市场应用-发展”,将徐徐展开。

其次,技术叠加的特征,在商业上,就使得中国公司的逼近更加容易。

随着信息技术的发展,技术扩散的速度在变快,深度在变大。具有叠加特征的技术,更容易扩散。从OpenAI闯通大模型这条道路,到中国跟上,只有半年时间。一方面,这是因为技术扩散一直在持续地进行,公众觉得很新鲜,闻所未闻的技术领域,对于具有国际视野的国内同行业来说,都是有关注、并有一定跟随的。

既然是叠加,方向清楚了,投入资源去做,这恰好是中国擅长的。超算也是一种技术的暴力叠加。最近英特尔宣布完成世界第一超算“Aurora”,就由63744颗CPU处理器组成。基于这种叠加性,中国虽然在单个超级计算机中,暂时无法位列前五,但根据榜单显示,全球浮点运算性能最强的500台超级计算机中,中国部署的超级计算机数量位列全球第一(173台),占总体份额的34.6%。

第三,大模型,其实最难的是应用上的落地和创新,这也是中国擅长的。

大模型很重要的一个特征是,应用和技术的双轮驱动。一般而言,技术和应用是通过利润形成一个循环的。研发、开发新产品、高利润、然后再次投入研发。人工智能的发展也符合这个循环的规律。

而且,在这个循环之外,应用本身就促使人工智能的发展。打个比方,一个消费者再怎么高强度地使用一块CPU,不会对intel公司的研发产生影响,消费者仅仅只能贡献利润,购买的时候就完成了。但人工智能不一样的地方就在于,消费者使用得越多,人工智能就能获得更多的数据,更多的回馈,从而提升神经网络的能力。所以,AI大模型的发展,重应用、重解决实际问题。

在应用方面,中国的优势在于超大市场规模,场景丰富,市场规模大,反应及时,有很强的产品创新能力,有着自己独特的优势,有些方面已经领先美国。

大模型需要落到满足市场的实际需求,面向企业和个人的真实需求,这个时候场景特别重要。更多的场景,更多地解决真实需求,突出实用性,利于进行技术和需求匹配,就更能取得更好的效果,带动更快的技术发展。以腾讯为例,目前,腾讯混元大模型已经在腾讯云、腾讯广告、腾讯会议、腾讯文档、微信搜一搜、腾讯游戏等50个业务和产品接入测试。腾讯混元还将作为腾讯云MaaS(大模型即服务)服务的底座,通过API为不同产业场景构建专属应用。务实地以这些应用为基础,满足用户需求,坚持长跑,并在长跑中变得更加健壮,是中国大模型必然的发展逻辑。

当然,也应该清晰的认识到,中国也有自己的薄弱环节。meta的开源大模型LLaMA家族,性价比很高,正在成为主流开源模型,但目前从效果上看还是GPT效果要好很多。GPT3.0之后不再开源,其他大模型何时可以达到GPT的效果还是未知。在这种底层竞争上,中国的能力还有待提升。但是,只要把握住应用的这个关键,尊重科技的市场规律,不断持续从市场应用中获得利润、技术积累、人才积累,突破就是水到渠成的事。如果一味实施全面赶超战略,反而可能欲速则不达。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

  • 36
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值