原文链接:
https://mp.weixin.qq.com/s/zW-F7z8Fb5OVSY30tgy0eg
一、 大模型应用横向拓面、纵向深化,逐步夯实AI基础设施
【观察1】:大模型赋能范围不断延伸,增量价值备受多方关注
随着人工智能与实体经济不断融合,数据标注成本高、算力建设难度大、模型泛化能力差等发展瓶颈愈发显现,大模型凭借较强的模型性能和泛化能力,可极大降低技术门槛和开发成本,实现行业应用场景拓展从单点突破向多面协同转变,助力大模型落地实现横向拓面、纵向深化。在技术能力与市场需求的合力牵引下,企业需求将与技术研发形成双向互促的良性循环。据中国信息通信研究院(以下简称中国信通院)大模型案例征集结果显示,目前大模型已在互联网、电信、证券、银行、教育等多个领域场景探索落地,其中互联网、电信、IT等行业积极拥抱大模型,案例申报占比超过5成。此外,大模型在识别、分类、检测等通用场景占比较高,生成类场景将成为未来重点发力方向。大模型带来的增量价值引人注目,正逐步成为人工智能领域的“新高地”。据IDC报告显示,未来超过80%的组织会优先考虑购买预先训练好的人工智能模型。
【观察2】:大模型技术生态双向发力,工具平台加速行业渗透
2018年GPT、BERT等模型的提出预示大模型时代的到来,2021年起我国大模型进入爆发期,产学界呈现百家争鸣的发展格局,先后涌现出M6、盘古、悟道2.0、文心3.0、紫东太初、源1.0、书生等面向中文的大模型,近年来大模型的发展重心逐步由学术打榜向生态建设迁移,以大模型为纽带,向下带动基础软硬件产业发展,向上支撑人工智能应用创新与产业落地。大模型生态建设已成为多方关注焦点,继2022年后,大模型两度蝉联百度和阿里巴巴十大科技趋势预测前列,成功入选中国信通院2023年ICT十大趋势。华为、百度等头部企业均倾力打造大模型应用平台,包含高效便捷的开发套件、微调组件和部署套件,让大模型易开发、易适配、易部署,从单点技术创新到赋能行业应用,强势助力AI产业快速发展,加速AI技术行业渗透,推动AI成为软硬件产品的核心组件。
【观察3】:大模型生成能力日益突出,持续推动AIGC应用落地
当前内容生成技术的目标已由初阶的追求真实性和相关性进阶到侧重多样性和可控性,同时生成内容的组合性也在不断提高,新需求的出现对传统的人工智能算法提出挑战。大模型在自然语言处理、计算机视觉、跨模态等领域上的能力为内容生成技术的提升提供了强力支撑。大模型具备较好的拓展性,支持多模态信息融合,能基于强大的计算能力,高效产出预期内容。2022年是人工智能生成内容(以下简称AIGC)的应用元年,大模型凭借优越能力筑牢AIGC发展基础,扩展其在传媒、电商、影视、娱乐等领域中的应用边界,其中文心、紫东太初、通义、ChatGPT等大模型在对话问答、绘画写作、视频创作、手语生成等场景下不断创新,备受业界广泛关注。
【观察4】:大模型成为科学智能新工具,加速催生科研新范式
近年来,随着各界对AI for Science研究范式的积极探索与深入实践,以机器学习为代表的人工智能为基础科学研究带来全新的高维函数表示和数据分析工具,宏观和微观科学计算领域也实现数据大量积累和模型深度探索,为领域预训练模型的发展奠定了坚实基础。目前国内大模型在流体模拟、生物医药、材料化学等领域得到了广泛应用,如华为云提出高分辨率的全球人工智能气象预报系统——盘古气象大模型,百度发布面向生物计算的化合物表征学习HELIX-GEM模型和蛋白质结构分析HELIX-Fold模型,中国商飞发布了大型飞机仿真测试的流体模拟模型,西安交通大学相关团队借助大模型在超级抗药菌领域取得了突破等。
二、 中国信通院多项举措并重,全力助推大模型可信发展
【工作1】:大模型标准初成体系,编制工作稳步推进
随着数据、算力和算法的进一步发展,国内外相关企业、研究机构正在加大力度研究和开发更大规模、更强性能的预训练模型。作为人工智能新基建的强劲引擎,大模型已逐步上升为前瞻性和战略型技术。然而,当前大模型技术和应用标准体系尚不健全,盲目发展不仅拉高创新门槛,也削弱了产业活力。
中国信通院和中国人工智能产业发展联盟高度关注大模型发展态势,积极开展相关研究工作,为健全大模型标准体系,夯实大模型研发基础,引导大模型技术可持续发展,牵头开展了《大规模预训练模型技术和应用评估方法》系列标准制定工作。目前模型开发、模型能力两部分标准已发布,模型应用标准初步定稿,安全可信标准编制工作正在进行中。
【工作2】:大模型评测紧扣可信,多维解析模型能力
中国信通院联合技术供应方、方案集成方、应用需求方共同梳理了大模型工程化重要阶段,并围绕大模型全生命周期,紧扣各工程化阶段特点构建大模型评测体系,多视角评估大模型在模型开发、模型能力、模型应用和安全可信四个维度的能力。2022年,中国信通院开放模型开发与模型能力两个测试模块,现已为2家企业累计提供4个模块的产品评测,其中华为、百度在参测的模型开发和模型能力两个模块中均取得4+评级。
评测结果显示,模型开发方面,大模型开发流程趋于成熟和统一,参测大模型在数据管理、模型训练、模型管理、模型部署、开发流程一体化方面总体支持程度较高,未来将面向特定行业实现构建、训练、调优、部署一体化开发;模型能力方面,大模型能力评测兼顾共性和个性,总体反映参测大模型在语义、视觉、语音、多模态等能力上集成度较高,并已具备较好的性能。
【工作3】:大模型工作多维开展,共筑开源开放生态
为有序推进可信大模型发展进程,推动大模型产业向上向阳发展,中国信通院依托人工智能关键技术和应用评测工业和信息化部重点实验室,成立人工智能工程化推进委员会大模型工作组。目前,大模型工作组已吸纳成员单位50余家,覆盖大模型头部企业、互联网企业、科研院所、电信运营商、金融机构等,围绕技术研讨、产业交流、标准研制、评估测试、案例征集等方面已陆续开展多项工作,并得到产业各方的广泛支持。未来,中国信通院将持续跟踪大模型前沿动态,依托大模型工作组,聚焦产学研用各方力量,共同助推我国大模型技术和产业可信发展。
原文链接: