抢抓大模型发展机遇推动浙江数字经济二次“攀峰”

最新推荐文章于 2024-09-15 17:22:56 发布

hhaiming_

最新推荐文章于 2024-09-15 17:22:56 发布

阅读量854

点赞数 12

文章标签：人工智能 ai

本文链接：https://blog.csdn.net/m0_70839135/article/details/140521477

版权

人工智能大模型通常是指具有庞大参数规模，在海量数据上依托强大算力进行训练后，能完成不同下游任务的机器学习模型。大模型以强大的学习能力、泛化能力及可扩展性打破了人工智能技术发展的上限，加速推动生产力变革。自ChatGPT发布以来，国际头部企业和国内省市纷纷布局抢抓大模型发展先机。为把握本轮技术变革机遇，加快培育新质生产力，实现数字经济二次“攀峰”，本文在分析技术趋势及国内外发展动态的基础上，提出浙江抢抓大模型发展机遇的相关建议。

大模型前沿技术突破引爆新一轮产业变革****

**大模型技术正朝着多模态、自主智能、边缘智能演进。**一是从单模态向多模态。如OpenAI发布的文生视频大模型Sora，可由文本生成60秒视频。相比以往模型，Sora在时长、分镜等方面大幅优化，对现实世界理解、模拟的能力更强。二是迈向自主智能。将大模型作为智能体大脑，配合规划、记忆和工具等组件，可解决更多复杂任务，形成自主智能。斯坦福AI小镇展示了生成式智能体的高效协同。三是多终端渗透。随着模型轻量化和边缘算力提升，大模型在智能手机、PC等边缘端的渗透将更快。谷歌最新发布的开源大模型Gemma支持在笔记本电脑上运行。微软将在下一代PC上增设实体Copilot键，用于快速调用大模型助手。

**大模型赋能千行百业，极可能会引领一场生产力革命。**一是改变人机交互模式。大模型能更好地理解用户意图，打破传统人机交互的规则化模式，以满足用户个性化需求。二是革新内容生产模式。大模型似乎正在占领人类劳动最后的阵地——创造力和想象力，且大模型具备“无限生产”能力，由其支持的内容生产效率和质量都将显著提升。三是助力各行各业智能升级。基于通用大模型底座可快速搭建各行业的垂直大模型，用于赋能千行百业。据麦肯锡报告，大模型应用每年或将为全球GDP增加2.6-4.4万亿美元。如在工业领域实现工业设计的自动优化，在医疗领域实现病例自动化分析和生成，在金融领域用于优化客户服务体验等。

**全球大模型竞争持续深入，算力和数据成为必争之地。**中美两国发布的通用大模型总数占比达80%，是大模型技术的引领者。美国已形成以OpenAI+微软、Meta、谷歌为代表的头部阵营。中国积极追赶，已发布文心一言、盘古等典型产品，但仍面临算力“卡脖子”难题。一方面，随着大模型参数量和模态增加，算力需求暴增。据测算，从GPT-3到GPT-4，参数规模增大10倍，训练算力增加了64倍。另一方面，高端GPU由美国英伟达垄断，其全球市场占比超过80%。美国还通过1017新规等禁售令，限制高端GPU对华出口。大模型训练所需的高质量数据也较为紧缺。据Epoch AI测算，高质量文本数据将在2026年耗尽。OpenAI已与德国出版巨头Axel Springer达成合作，以每年数千万欧元的费用来获取高质量语料。

0****2

国内省份纷纷布局，抢抓大模型发展机遇

当前，国内多省抢抓机遇，正加快建设大模型创新高地。从国家网信办备案数据看，京沪粤三省领先优势明显。截至2024年2月，已备案大模型中，北京占比高达53.4%，其次是广东（17.1%）、上海（14.8%），浙江仅占比3.4%，排名第4（参见表1）。京沪粤等省份发展大模型的举措有以下几点：

**强化顶层设计引领，抢抓技术变革先机。**京沪粤皖等地均已发布大模型（通用人工智能）专项政策，从算力支持、场景开发、技术突破、生态建设等维度鼓励大模型创新。其中，北京发布的大模型政策最早、最系统。上海最先将保障AI产业发展提升到了立法层次。广东立足政务应用，发布了首部垂直领域大模型促进政策。此外，京沪粤皖等地在2024年政府工作报告中均有发展大模型的相关论述。

**完善数据和算力保障，打造高质量发展后盾。**数据方面，多渠道拓展高质量数据集供给。北京通过人工智能高质量数据集服务平台，发布涵盖十多个行业的59个数据集，总规模超过600T。上海成立语料数据联盟，依托数交所的数据交易板块促进高质量语料流通。广东拟基于政务数据建设高质量语料库；并通过“数据特区”引进境外数据。算力方面，一是加快智能算力建设。北京引导老旧小散数据中心向公共智能算力平台转型升级，强化智能算力供给。上海拟构建自主可控的万卡算力集群，缓解算力“卡脖子”问题。二是优化普惠算力服务。北京、上海推出算力定向补助政策，对企业算力支出提供最高10%的补贴，确保大模型企业算力“够用、好用”。

**强调落地应用，带动产业深度融合。**一是以政务应用形成大模型落地示范。北京、广州、深圳等地通过政府采购推动大模型率先在政务领域落地。北京将大模型用于政协提案选题推荐。深圳将大模型用于政府服务、城市治理等场景。二是加速垂直领域大模型赋能千行百业。目前，国内已备案大模型数量达到88个，涵盖金融、医疗、文旅、工业等领域，应用氛围浓厚。元保保险基于大模型的智能理赔应用将审核速度提升70%。北京友谊医院将大模型用于电子病历录入，效率提升80%。

**重视科技创新，促进关键技术突破。**一是加大对大模型基础研究的支持力度。上海的“基础研究特区”和广东的基础研究十年“卓粤”计划，均强调对人工智能等重点技术的长期投入。北京积极引导社会资金投入大模型研发。中国计算机学会联合百川智能、英博数科共同发起“CCF—百川—英博大模型基金”，支持大模型理论算法等关键技术联合攻关。二是以高能级科创平台打造创新“核爆点”。北京依托“中关村人工智能大模型产业集聚区”和门头沟区“京西智谷”，上海依托徐汇区“模速空间”等载体迅速集聚创新资源，加速大模型孵化。

0__3

浙江抢抓大模型发展机遇的对策建议

当前大模型正进入高速发展期，浙江应抢抓机遇，找准突破口，努力打造具有国际影响力的大模型产业发展高地。

**以数据资源全面开放提升高质量数据供给。**深化公共文本数据开放。围绕大模型数据需求，完善公共数据开放清单，加快可公开的政务文档、地方志等文本数据全面开放。构建高质量行业数据集。由政府牵头，引导行业协会、头部企业积极参与行业数据集建设。建设数据精细化标注众包服务平台，鼓励领域专业人员参与标注。探索数据集知识产权保护框架，充分利用区块链等技术，深化以贡献为导向的激励机制。打造科学数据开放共享枢纽设施。发挥之江实验室等高能级科创平台的技术人才优势，通过规范的科学数据汇聚协议和目录体系，突破多模态检索、跨域协同隐私保护等关键技术，联接国内外相关科学数据中心和平台，建设科学数据开放共享枢纽。

**持续推动智能算力建设确保算力充裕。**加快推动“万卡智算设施”建设。依托之江实验室“国家新一代人工智能公共算力开放创新平台”，联合杭钢、新华三等企业，打造超万卡规模智算中心，为千亿级大模型训练提供支撑。提升智能算力供给能力。积极谋划创建国家人工智能算力基地，充分利用既有智能算力资源，通过改造、整合、提升行动，建设一批超大型（算力规模超过1EFLOPS）智能算力集群。优化智能算力普惠服务。推动智算平台与开放社区建设，加强“AI算力券”等政策工具的引导，持续降低算力使用门槛。鼓励新型智能算力中心、基础电信企业、云服务龙头企业对科研院所、产业链中小企业等生态伙伴提供智能算力普惠服务。

**聚力突破大模型核心技术带动产业链协同发展。**建设人工智能训练平台，抢占模型训练制高点。建立省级大模型训练平台，提供数据处理、预训练、调优等训练功能，支持大模型一站式开发和运维。强化通用大模型研发。以省级科技攻关项目为牵引，加快研制多模态、跨领域通用大模型。加速国产化训练与推理适配研发，形成自主可控的大模型技术体系。加强大模型评测体系研发。围绕大模型通用性、智能性、鲁棒性等维度，开发评测工具集。建设大模型评测开放服务平台，加强评测结果应用，为各行业应用大模型提供支撑。

**推动大模型多场景应用助力数字经济二次“攀峰”。**推进政务大模型应用。围绕政务咨询、公文写作等场景，利用大模型语义理解和推理优势，推进政务办事精准指引和公务履职高效支撑。加速科学大模型落地。依托之江实验室、浙江大学等载体，协调算力资源和科学数据集，推动科学大模型在生命科学、新材料、地学、天文等领域的应用，打造科学研究新范式。实施行业大模型示范应用推进计划。重点支持医疗、教育、金融、机器人等行业构建大模型示范应用场景，打造标杆性产品，形成示范应用清单和产品推荐目录。支持国有企事业单位优先采用经测试评估的大模型产品。

**优化制度环境破解大模型发展和治理难题。**制定浙江省大模型专项发展政策，谋划《浙江省促进人工智能产业发展条例》立法工作，以大模型产业弯道超车，促进浙江省人工智能产业进一步跃升。开展潜在风险先行研究。对大模型风险进行科学监测、评估和预警。围绕就业冲击、隐私保护、知识产权等领域，以企业内审、行业自律和公众监督推动建立有序开放的行业生态。鼓励浙江省大模型产品积极备案。督促大模型企业积极开展自评估，为企业提供备案指导和咨询服务，争取更多本省优质的大模型产品更快更好地上线服务。