抢抓大模型发展机遇 推动浙江数字经济二次“攀峰”

人工智能大模型通常是指具有庞大参数规模,在海量数据上依托强大算力进行训练后,能完成不同下游任务的机器学习模型。大模型以强大的学习能力、泛化能力及可扩展性打破了人工智能技术发展的上限,加速推动生产力变革。自ChatGPT发布以来,国际头部企业和国内省市纷纷布局抢抓大模型发展先机。为把握本轮技术变革机遇,加快培育新质生产力,实现数字经济二次“攀峰”,本文在分析技术趋势及国内外发展动态的基础上,提出浙江抢抓大模型发展机遇的相关建议。

01

大模型前沿技术突破引爆新一轮产业变****

**大模型技术正朝着多模态、自主智能、边缘智能演进。**一是从单模态向多模态。如OpenAI发布的文生视频大模型Sora,可由文本生成60秒视频。相比以往模型,Sora在时长、分镜等方面大幅优化,对现实世界理解、模拟的能力更强。二是迈向自主智能。将大模型作为智能体大脑,配合规划、记忆和工具等组件,可解决更多复杂任务,形成自主智能。斯坦福AI小镇展示了生成式智能体的高效协同。三是多终端渗透。随着模型轻量化和边缘算力提升,大模型在智能手机、PC等边缘端的渗透将更快。谷歌最新发布的开源大模型Gemma支持在笔记本电脑上运行。微软将在下一代PC上增设实体Copilot键,用于快速调用大模型助手。

**大模型赋能千行百业,极可能会引领一场生产力革命。**一是改变人机交互模式。大模型能更好地理解用户意图,打破传统人机交互的规则化模式,以满足用户个性化需求。二是革新内容生产模式。大模型似乎正在占领人类劳动最后的阵地——创造力和想象力,且大模型具备“无限生产”能力,由其支持的内容生产效率和质量都将显著提升。三是助力各行各业智能升级。基于通用大模型底座可快速搭建各行业的垂直大模型,用于赋能千行百业。据麦肯锡报告,大模型应用每年或将为全球GDP增加2.6-4.4万亿美元。如在工业领域实现工业设计的自动优化,在医疗领域实现病例自动化分析和生成,在金融领域用于优化客户服务体验等。

**全球大模型竞争持续深入,算力和数据成为必争之地。**中美两国发布的通用大模型总数占比达80%,是大模型技术的引领者。美国已形成以OpenAI+微软、Meta、谷歌为代表的头部阵营。中国积极追赶,已发布文心一言、盘古等典型产品,但仍面临算力“卡脖子”难题。一方面,随着大模型参数量和模态增加,算力需求暴增。据测算,从GPT-3到GPT-4,参数规模增大10倍,训练算力增加了64倍。另一方面,高端GPU由美国英伟达垄断,其全球市场占比超过80%。美国还通过1017新规等禁售令,限制高端GPU对华出口。大模型训练所需的高质量数据也较为紧缺。据Epoch AI测算,高质量文本数据将在2026年耗尽。OpenAI已与德国出版巨头Axel Springer达成合作,以每年数千万欧元的费用来获取高质量语料。

0****2

国内省份纷纷布局,抢抓大模型发展机遇

当前,国内多省抢抓机遇,正加快建设大模型创新高地。从国家网信办备案数据看,京沪粤三省领先优势明显。截至2024年2月,已备案大模型中,北京占比高达53.4%,其次是广东(17.1%)、上海(14.8%),浙江仅占比3.4%,排名第4(参见表1)。京沪粤等省份发展大模型的举措有以下几点:

**强化顶层设计引领,抢抓技术变革先机。**京沪粤皖等地均已发布大模型(通用人工智能)专项政策,从算力支持、场景开发、技术突破、生态建设等维度鼓励大模型创新。其中,北京发布的大模型政策最早、最系统。上海最先将保障AI产业发展提升到了立法层次。广东立足政务应用,发布了首部垂直领域大模型促进政策。此外,京沪粤皖等地在2024年政府工作报告中均有发展大模型的相关论述。

**完善数据和算力保障,打造高质量发展后盾。**数据方面,多渠道拓展高质量数据集供给。北京通过人工智能高质量数据集服务平台,发布涵盖十多个行业的59个数据集,总规模超过600T。上海成立语料数据联盟,依托数交所的数据交易板块促进高质量语料流通。广东拟基于政务数据建设高质量语料库;并通过“数据特区”引进境外数据。算力方面,一是加快智能算力建设。北京引导老旧小散数据中心向公共智能算力平台转型升级,强化智能算力供给。上海拟构建自主可控的万卡算力集群,缓解算力“卡脖子”问题。二是优化普惠算力服务。北京、上海推出算力定向补助政策,对企业算力支出提供最高10%的补贴,确保大模型企业算力“够用、好用”。

**强调落地应用,带动产业深度融合。**一是以政务应用形成大模型落地示范。北京、广州、深圳等地通过政府采购推动大模型率先在政务领域落地。北京将大模型用于政协提案选题推荐。深圳将大模型用于政府服务、城市治理等场景。二是加速垂直领域大模型赋能千行百业。目前,国内已备案大模型数量达到88个,涵盖金融、医疗、文旅、工业等领域,应用氛围浓厚。元保保险基于大模型的智能理赔应用将审核速度提升70%。北京友谊医院将大模型用于电子病历录入,效率提升80%。

**重视科技创新,促进关键技术突破。**一是加大对大模型基础研究的支持力度。上海的“基础研究特区”和广东的基础研究十年“卓粤”计划,均强调对人工智能等重点技术的长期投入。北京积极引导社会资金投入大模型研发。中国计算机学会联合百川智能、英博数科共同发起“CCF—百川—英博大模型基金”,支持大模型理论算法等关键技术联合攻关。二是以高能级科创平台打造创新“核爆点”。北京依托“中关村人工智能大模型产业集聚区”和门头沟区“京西智谷”,上海依托徐汇区“模速空间”等载体迅速集聚创新资源,加速大模型孵化。

0__3

浙江抢抓大模型发展机遇的对策建议

当前大模型正进入高速发展期,浙江应抢抓机遇,找准突破口,努力打造具有国际影响力的大模型产业发展高地。

**以数据资源全面开放提升高质量数据供给。**深化公共文本数据开放。围绕大模型数据需求,完善公共数据开放清单,加快可公开的政务文档、地方志等文本数据全面开放。构建高质量行业数据集。由政府牵头,引导行业协会、头部企业积极参与行业数据集建设。建设数据精细化标注众包服务平台,鼓励领域专业人员参与标注。探索数据集知识产权保护框架,充分利用区块链等技术,深化以贡献为导向的激励机制。打造科学数据开放共享枢纽设施。发挥之江实验室等高能级科创平台的技术人才优势,通过规范的科学数据汇聚协议和目录体系,突破多模态检索、跨域协同隐私保护等关键技术,联接国内外相关科学数据中心和平台,建设科学数据开放共享枢纽。

**持续推动智能算力建设确保算力充裕。**加快推动“万卡智算设施”建设。依托之江实验室“国家新一代人工智能公共算力开放创新平台”,联合杭钢、新华三等企业,打造超万卡规模智算中心,为千亿级大模型训练提供支撑。提升智能算力供给能力。积极谋划创建国家人工智能算力基地,充分利用既有智能算力资源,通过改造、整合、提升行动,建设一批超大型(算力规模超过1EFLOPS)智能算力集群。优化智能算力普惠服务。推动智算平台与开放社区建设,加强“AI算力券”等政策工具的引导,持续降低算力使用门槛。鼓励新型智能算力中心、基础电信企业、云服务龙头企业对科研院所、产业链中小企业等生态伙伴提供智能算力普惠服务。

**聚力突破大模型核心技术带动产业链协同发展。**建设人工智能训练平台,抢占模型训练制高点。建立省级大模型训练平台,提供数据处理、预训练、调优等训练功能,支持大模型一站式开发和运维。强化通用大模型研发。以省级科技攻关项目为牵引,加快研制多模态、跨领域通用大模型。加速国产化训练与推理适配研发,形成自主可控的大模型技术体系。加强大模型评测体系研发。围绕大模型通用性、智能性、鲁棒性等维度,开发评测工具集。建设大模型评测开放服务平台,加强评测结果应用,为各行业应用大模型提供支撑。

**推动大模型多场景应用助力数字经济二次“攀峰”。**推进政务大模型应用。围绕政务咨询、公文写作等场景,利用大模型语义理解和推理优势,推进政务办事精准指引和公务履职高效支撑。加速科学大模型落地。依托之江实验室、浙江大学等载体,协调算力资源和科学数据集,推动科学大模型在生命科学、新材料、地学、天文等领域的应用,打造科学研究新范式。实施行业大模型示范应用推进计划。重点支持医疗、教育、金融、机器人等行业构建大模型示范应用场景,打造标杆性产品,形成示范应用清单和产品推荐目录。支持国有企事业单位优先采用经测试评估的大模型产品。

**优化制度环境破解大模型发展和治理难题。**制定浙江省大模型专项发展政策,谋划《浙江省促进人工智能产业发展条例》立法工作,以大模型产业弯道超车,促进浙江省人工智能产业进一步跃升。开展潜在风险先行研究。对大模型风险进行科学监测、评估和预警。围绕就业冲击、隐私保护、知识产权等领域,以企业内审、行业自律和公众监督推动建立有序开放的行业生态。鼓励浙江省大模型产品积极备案。督促大模型企业积极开展自评估,为企业提供备案指导和咨询服务,争取更多本省优质的大模型产品更快更好地上线服务。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值