运营商AI机遇:以大模型拓展全新赛道

东数西算正在成为各行业的普遍机遇,对于运营商来说也是如此。

东数西算带来了全新的算力网络建设需求,以及各行业普遍的网络升级需求。在这一大背景下,运营商还需要一系列细分的价值节点来推动业务进步,打开市场空间。换言之,东数西算的路有了,运营商接下来更需要关注路上跑哪些车。

在东数西算的整体架构中,AI预训练大模型的价值值得关注。近年来,大模型可谓AI领域最受关注的方向。高鲁棒性的模型效果,卓越的数据集表现,以及跨模态等领域的不可替代性,让大模型成为产业界与学界共同关注的对象。一时间,“炼大模型”成为了AI产业的共同需求,为此也衍生出配套产业的全新机遇。

大模型的算力要求非常严苛,并且需要一系列软硬件基础设施的支撑,比如基于昇腾AI的人工智能计算中心。不过,单个的计算中心之间算力供给存在差异,因此在东数西算的背景下,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动,能更好地促进大模型产业发展。

对于运营商来说大模型带来了一系列全新的AI市场空间。运营商帮助大模型进行跨地域训练,完成算力资源适配,构成了新的服务机会;而运营商本身运用大模型,也可以提升服务能力与产业效率。

运营商的新赛道:

大模型训练带来的市场想象

OpenAI在2018年发布了一份著名的调查报告,从2012年开始,全球AI算力在六年间增长了30万倍,并且还在持续增长。而当大模型时代正式到来,全球AI算力需求进一步加大。AI算力成为了限制产业智能化发展的主要挑战。

2018年,谷歌发布了NLP领域的预训练模型Bert,其优越的能力快速得到业界认可。OpenAI打造的GPT-3在多项任务中实现了跨越级的表现,推动全球大模型迎来了爆发式的发展,模型参数呈现了指数级的增长。“大数据+大模型”成为了AI产业最受重视的发展之路。

但在实践过程里,我们却可以发现大模型在训练与部署中存在着诸多挑战。比如部署场景中存在的模型性能不足问题;不同场景下大模型的泛化能力不强;预训练大模型参数多、计算量大,训练成本高企等等。其中,如何低成本、高效率地完成大模型训练,成为首先需要解决的问题。在这种背景下,将大模型在东数西算背景体系下进行模型训练,正在成为越来越多企业与学术机构的选择。

比如中国科学院自动化研究所在 2021 世界人工智能大会上发布了跨模态通用人工智能平台——“紫东.太初”。其依托面向超大规模的高效分布式训练框架,构建了具有性能优良的中文预训练模型、语音预训练模型和视觉预训练模型,并开拓性地通过跨模态语义关联实现了“视觉-文本-语音”三模态统一表示,构建了三模态预训练大模型,赋予跨模态通用人工智能平台多种核心能力。从应用层面上看,“紫东.太初”兼具跨模态理解和生成能力,在“以图生音”和“以音生图”等方向上具有广泛的应用空间,可以实现AI为视频配音、AI语音播报、AI海报创作等应用场景。

2022年,千博信息基于昇腾AI和昇思MindSpore AI框架,利用“紫东.太初”三模态大模型,打造了手语教考一体机,开创性地实现手语动作与示意图片和文字的联动。目前,该一体机已在湖南数十个学校陆续上线,一定程度上缓解了手语师资短缺问题,带来了重要的社会价值。

而在“紫东.太初”大模型的训练过程中,就非常能够展现出东数西算背景下,大模型进行“东数西训”的典型逻辑。这一模型由中科院自动化所相关团队主导,基于昇腾AI基础软硬件平台,在武汉人工智能计算中心完成训练。可以说提前替更多大模型尝试了“东部数据-中西部算力训练-东部应用”的产学研结合方式。

以此为案例,我们可以看到运营商的AI新市场正在快速打开。而能够让运营商服务大模型的新市场打开,产业底座的完善性至关重要。

昇腾底座:

为运营商AI赛道保驾护航

大模型走上“东数西训”之路,有几个必要的产业条件:算法、数据、算力、训练所需的软硬件基础设施、算力网络。

从目前阶段来看,大模型的训练算法已经日益完善,国际与国内的大模型训练基础门槛不断降低。接下来是数据,东部地区的企业、高校、科研机构积累了丰富的数据,可以有效投入大模型的训练当中。这也是中国在大模型之路上虽然后起,却能够奋起直追的原因。

接下来是算力,随着各地人工智能计算中心拔地而起,以集群化、集中化的AI算力来完成大模型训练,已经成为可能。昇腾AI提供的AI算力体系,既可以作为人工智能计算中心的建设基础,也可以通过多种方式赋能产学研各界,带来充沛、完整的AI算力供给。

而在软硬件配套设施层面,昇腾AI基础软硬件平台,包括Atlas系列硬件和伙伴硬件、异构计算架构CANN、全场景AI框架昇思MindSpore、昇腾应用使能MindX、全流程开发工具链MindStudio 和一站式AI开发平台ModelArts等。为了能够满足越来越多企业与学术机构的大模型训练需求,昇腾AI已经打造了大模型的全流程使能体系。该体系包含从大模型规划、大模型开发到大模型产业化的全流程,可以实现端到端加速大模型产业落地。

我们可以看到,在大模型的需求与基础技术崛起后,以昇腾AI为代表的规模化、产业化AI基座已经走向完善。大模型不但是能训,更加走上了简单、高效、低门槛可训的新周期。

大模型的最后一个关键需求就是网络与网络配套服务,而这可以成为运营商的重大机遇。可以说,昇腾为运营商的AI赛道起到了保驾护航的价值。

以AI拓展未来:

运营商创新正当时

AI技术在运营商业务版图中的重要性正在不断上升。早在2020年,Omdia的ICT-Enterprise Insights就公布了一项调查数据,有近80%的全新运营商认为使用AI技术是一项“重要”或“非常重要”的IT项目,其中近60%的运营商计划增加对AI工具的投资。

我们可以看到,如今在运营商使用AI、应用AI的场景与价值已经非常广泛。比如面对5G网络复杂的运维管理需求,主流运营商都已经使用AI技术来实现网络的智能分析、实时预测和自动化运维。在智能客服与智能外呼平台中,NLP与多轮对话技术已经成为提升运营商服务触达效率的关键。AI技术也是运营商专网服务等新模式的重要助力,比如在冬奥期间,中国联通就通过AI、云计算、区块链技术与5G结合,护航智慧冬奥。与此同时,运营商在AI技术上的投入与建设水准也在不断加强。

在这个大背景下,用好AI技术,以及服务客户用好AI技术都成为运营商的关键需求。而昇腾底座恰好可以为运营商带来广泛且关键的支撑作用。比如说,浙江移动就依托九天平台+昇腾底座,构建了全栈自主创新的行业AI赋能试验平台,提供面向行业的人工智能基础设施,可实现数据赋能、算法赋能、应用赋能。该平台预置了900+算法和800+预训练模型,可快速定制算法模型,以满足城市多样化的场景应用需求。通过开放标准化接口,模块化方案组合,为城市管理提供多场景的AI服务,全力推进算力成为像水电一样“一点接入,即用即取”的公共服务。

面向未来,我们可以看到更行业、产学研各界都在涌现出大模型的训练与部署需求。进一步来看,大模型属于产业级AI能力与应用的一部分。除了一般意义上的预训练大模型,还有更多重度AI模型、AI能力需要践行跨地域的训练。

与此同时,运营商本身也是大模型与重型AI能力的需求主体。5月16日,浙江移动在电信日发布的 “杭小忆”就是基于“紫东.太初”,叠加杭州特色景点——南宋御街的场景,进行高效的本地化增量训练打造而成的文旅数智人。

面向未来,会有越来越多的大模型踏上东数西算之路。不久之前,“中国算力网-智算网络”正式上线,这是中国算力网络建设迈出的重要一步。接下来,会有包括大模型在内的大量AI任务在算力网络中完成训练与部署。而运营商可以在算力网络的基础上,共同参与建设算力网络统一大市场,实现全程全网的社会级算力服务,这对于运营商来说是一个巨大机遇。运营商既可以成为算力网络建设的主力军,也将从AI带来的网络增量中主要获益。

这些趋势与变化,正在构成运营商的全新赛道。大模型训练带来网络需求增加,配套网络服务更加复杂。这些特点都可以为运营商带来极高的价值增量,并且助力打开东数西算大背景下的连续性市场空间。

大模型的产业纪元面前,运营商手中掌握着大模型产业化的最后一块拼图。运营商关注、发力这一市场,也有助于大模型走向规模化应用与产业级繁荣。

未来,大模型训练者、昇腾AI、运营商与产业需求的“四方联动”,将构成一个高效率、低门槛的产业范式,推动AI黄金时代的到来。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

  • 28
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值