2023发展负责任的生成式人工智能研究报告及共识文件

今天分享的是人工智能系列深度研究报告:《2023发展负责任的生成式人工智能研究报告及共识文件》。

(报告出品方:世界互联网大会人工智能工作组)

报告共计:30页

图片

概述

近年来,生成式人工智能不断取得突破,展现出 强大的生成创造能力,开始涌现出“智慧”。生成式人 工智能在文本、代码、图像、音视频等方面的理解与生成取得了突破性进展,有望大幅提升社会生产力,加 速千行百业的数字化进程,促进人类社会全面迈向智能化新阶段。

回顾人工智能60余年的发展历程,技术突破不 仅会创造发展机遇,也会带来相应的挑战。统筹人工 智能发展和治理逐渐成为全球共识,自2016年以来, 全球多个国际组织、国家、地区及产业界,积极探索人 工智能发展与治理路径,已经形成了系列共识原则、 治理要求、实践范式等。考虑到人工智能尚处在快速发展的过程中,相关工作仍需要持续推进。

生成式人工智能演进速度之快、赋能范围之广、影响程度之深前所未有。以负责任的态度推动生成式人工智能发展不仅十分必要,也愈发紧迫,是事关人工智能乃至人类文明发展的重要命题。为此,世界互联网大会成立人工智能工作组,广泛汇聚各方智慧形成共识,推动生成式人工智能发展与治理协同共进,增进全人类共同福祉。

图片

全球生成式人工智能技术发展态势

(一)“模型、数据、算力”三大要素的演进带动人工智能不断突破

生成式人工智能技术突飞猛进,展现出惊人的创造能力和生成能力,主要得益于模型、数据、算力等方面的不断提升。

模型层面,模型结构的创新和模型规模的提升成 为生成式人工智能取得突破的关键。从模型结构来 看,注意力机制、自回归模型、扩散模型等技术不断升 级迭代,特别是以Transformer为主的基础模型脱颖 而出,成为生成模型主流技术路线,推动文本、图像、 音频、视频等内容的生成和理解能力不断提高。涌现 出ChatGPT、文心一言等大语言模型,Stable Diffu-sion、DALL-E2、DALLE3等视觉生成模型,以及GPT-4、BLIP-2、Emu等多模态模型。从模型参数规模来看,上述新模型架构使得参数规模不断增大成为可能,带来模型能力质的飞跃。以GPT系列模型为例,2020年发布的GPT-3参数规模有1750亿,相比于2018年发布的参数规模为1.17亿的GPT-1,在复杂自然语言处理方面实现了显著提升。此外,围绕基础模型衍生出的插件机制,可以将外部的搜索、数据处理等功能与基础模型能力集成,从而进一步丰富模型功能,拓展应用范围。OpenAl、360、百度、华为、科大讯飞等企业均推出了相应的模型插件,例如文心一言上线的搜索、交互等插件,使模型更容易实现功能的扩展和定制,以适应多种场景的需求。

数据层面,数据质量、多样性、规模等方面的进步成为人工智能能力提升的基础。被广泛用于大模型预训练的The Pile数据集,主要基于学术或专业领域知识构造,具有较高质量,包含了维基百科、书籍、期刊、Reddit链接、Common Crawl等20余个数据集。北京智源人工智能研究院发布的大规模文本对数据集 MTP,范围涉及搜索、社区问答、百科常识、科技文献等,数据规模达到3亿对。Anthropic、斯坦福大学、Hugging Face 等单位发布的微调数据集,涵盖了多种类型的指令,有助于提升模型的可控性,使模型更好地理解和遵循人类指令。此外,合成数据可能成为高质量数据的重要来源之一。生成式人工智能能够大批量制作拟真合成数据,或将帮助缓解高质量训练数据枯竭这一未来潜在问题。根据Gartner预测,到2024年,60%用于人工智能开发和分析的数据将会是合成数据;到2030年合成数据将取代真实数据,成为人工智能模型所使用数据的主要来源。

算力层面,算力设施的完善支撑生成式人工智能的快速发展。人工智能芯片提供算力基础保障,GPU、FPGA、NPU、TPU 等不同技术路线芯片持续探索,针对人工智能计算不断优化,为模型的训练与推理提供了基础保障。深度学习框架放大芯片算力效能,一是通过提供高性能的大规模分布式训练与推理技术,有效缓解模型训练耗时长、推理算力需求高等问题。二是通过与底层芯片适配优化,充分发挥硬件性能,提高计算效率。云边端多样化算力满足生成式人工智能不同应用需求,云侧强大的计算和存储能力保障大模型训练以及高吞吐量应用的推理任务;边缘算力将海量复杂数据进行本地化预处理,可对数据进行实时处理并将其导向大模型,实现快速响应和决策;端侧算力减少数据处理和传输的延迟,直接在端侧进行数据计算分析,提升智能应用的实时性。

(二)开源开放驱动生成式人工智能生态渐趋繁荣

模型开源促进技术的发展和普及。以LLaMA 2、BLOOM、ChatGLM、Baichuan、Aquila、InternLM、Qwen等为代表的开源模型层出不穷,并且不断升级进化。在模型迭代优化方面,模型开源的兴起扩大了企业对基础模型和微调模型的选择范围,目前大量创业公司使用LLaMA2、Stable Diffusion等开源模型调优并推出新产品。在研发门槛降低方面,应用开源模型具有规避初始高昂投资、私有数据的完全控制、可自我迭代优化等优势。开发者基于开源模型,可快速搭建具备专业领域知识的垂类任务模型,大幅缩减了模型从开发到应用所需的算力、数据和时间成本。例如,开源平台Github上显示,基于智谱AI开发的Chat-GLM开源模型,大幅降低了研发门槛,有11个模型脱颖而出,覆盖医疗、法律、金融、教育等多个领域。

开放接口为开发者提供便捷。除了模型开源,开放易用的API和SDK也是促进人工智能生态繁荣的重要一环。一方面,接口开放将简化开发流程并提升效率。开放接口帮助开发者无需从头开始编写算法或模型,大大简化开发流程,减少开发时间和工作量。例如,通过调用GPT-3.5-Turbo模型API开放接口,仅需少量Python代码就可实现代码生成、对话代理、语言翻译、辅助学习等复杂功能。另一方面,接口开放可以丰富模型的应用场景。接口开放可以帮助广大开发者更便捷地接入模型能力,形成更加多样化的应用场景。例如,百度文心一言提供的接口可以应用于搜索、推荐、对话等场景,提升应用效果和用户体验。

(三)生成式人工智能发展凸显通用人工智能曙光

生成式人工智能的突破加快了通用人工智能的探索步伐。生成式人工智能不仅能够处理单一数据类型的任务,而且可以在不同数据类型间建立联系和融合,向着多模态方向发展。多模态生成模型的突破显著提高机器智能的拟人性和通用性。AI Agent伴随着多模态生成模型技术的突破,能够更好地理解和处理复杂的现实场景,从而为人类提供更为精准、个性化的服务。多模态生成模型与智能体的结合带来更多可能性。具身智能将多模态生成模型与机器人技术结合,通过模仿人类学习来感知复杂的世界,实现“感官”(硬件)与“思考”(软件)的多模态融合,协助人类完成各种任务。例如,谷歌发布的Robotic Transformer2(RT2)作为视觉-语言-动作(VLA)模型,将视觉-语言模型(VLM) 预训练与机器人数据相结合,直接控制机器人,使其在真实世界中执行各种任务。

图片

图片

图片

生成式人工智能带来的机遇

(一)促进经济发展

生成式人工智能推动生产力大幅提升,带动全球经济增长。根据麦肯锡2023年6月预测,生成式人工智能每年可能为全球经济增加2.6万亿至4.4万亿美元的价值“。根据高盛研究,生成式人工智能的突破将在10年内推动全球GDP增长7%5。当前,生成式人工智能带来的生产力升级正在推动生产方式的进化,为全球经济发展打开新的机会之窗。类似于传统AI,生成式人工智能展现自动化优势,一方面,AI通过自动化实现对人类部分工作的替代,提高经济生产效率,另一方面,AI 通过自动化对前沿技术进行模仿与创新,加速技术研发与扩散”。区别于传统AI,生成式人工智能具有实现通用性的潜力,预示着应用领域的AI互相统一协同,从而会在社会经济活动的各个领域发挥更大作用”。生成式人工智能将优化生产流程、管理方式、营销策划等环节,推动传统生产方式升级。

生成式人工智能对产业带来深远影响,对不同性质行业影响次序不一。随着生成式人工智能与各行各业深度融合,其赋能重构的行业将会持续增加。根据罗兰贝格的评估分析,生成式人工智能将率先对互联网与高科技、金融和专业服务等知识密集型行业带来较大影响,分别带来6.5%、6.8%、11.3%的成本下降;其次将赋能教育、通信、医疗、公共服务零售、文娱和传媒等服务型行业;对当前数字化程度不高的农业、材料、建筑业、能源等传统行业影响相对较小。总的来看,生成式人工智能的价值发挥需要坚实的信息化、数字化支撑,有望在相关行业的研发设计、生产制造、运营管理方面创造巨大价值。

生成式人工智能深入赋能数字经济,为各行业领域带来新一轮发展机遇。伴随着生成式人工智能影响规模的不断扩大,赋能各行各业实现数字化变革与发展。金融业领域,生成式人工智能能够帮助绘制金融风险图,协助打击洗钱等金融犯罪1。汽车业领域,生成式人工智能能够提高车载智能语音交互效率,还能为自动驾驶模型训练提供高质量合成数据,帮助解决自动驾驶系统开发过程中的数据和测试难题11。更进一步,多模态生成模型正有望加速推动“多模态感知到决策规划”的端到端自动驾驶落地应用。传媒业领域,生成式人工智能可以根据文本提示生成文字、图片、音频、视频等,为广告配上引人入胜的视觉内容。制造业领域,生成式人工智能可以应用于机器视觉、数位分身和自主导航系统等,实现生产线和仓储物流等环节的无人化和智能化。农业领域,生成式人工智能可以通过遥感大模型测量农作物的长势12,监测作物病害,预测农作物产量。生成式人工智能的进步性价值将持续推动各行业领域质量变革、效率变革、动力变革,推动经济高质量发展。

(二)促进社会进步

生成式人工智能可以有效优化城市运营服务。生成式人工智能能够通过持续分析数据来标记城市运营问题并优化策略13。例如,可通过分析能源网格数据生成更优的能源使用策略。还能够识别不同灾害类型的潜在模式和规律,通过实时数据的监测和分析进行灾害预警,灾害发生后可以通过分析事故和灾害数据,辅助进行灾后评估、资源调配、救援规划等工作,提供实时预警和全面的风险管理解决方案。

生成式人工智能可以对教育产生有益影响。从提供发展机遇角度而言,生成式人工智能可以在信息检索、学习规划、协同创作等方面发挥优势15,协助提升教育教学质量16。从促进教育公平角度而言,生成式人工智能可以被用于建设开放的教育平台,为不同地区学生提供平等资源,帮助弥合教育鸿沟。

生成式人工智能可以促进就业市场扩容提质。一方面,生成式人工智能能够调整就业结构,增加语言模型训练师、事实核查员、机器人检测工程师、数据标注师等新兴职业。另一方面,利用生成式人工智能生成文档、处理数据、展示图表、团队协作.能够提升工作效能。根据全球劳工组织(ILO)的报告,全球预计4.27亿份工作可借助生成式人工智能技术得到优化或效率提升。

生成式人工智能可以带动智慧医疗、智慧养老发展。在智慧医疗方面,生成式人工智能应用于分诊导诊、医学成像、临床诊断和个性化医疗干预等场景,有助提高许多临床及管理应用的效率及准确性,改善医疗服务和患者就医体验。在智意养老方面,生成式人工智能通过实时监测分析被看护人的生理指标并标记异常情况,能够帮助看护人及时调整护理方案,惠及日益增长的养老护理需要。

(三) 助力公益事业

生成式人工智能帮助打造无障碍的数字环境。例如利用基于深度神经网络的语音合成技术,生成更接近真人的声音,提供更加丰富的有声读物。生成式人工智能的跨模态能力对残障人群能产生更大效用,字幕眼镜、手语数字人等应用能够帮助建设无障碍的工作环境。

生成式人工智能助力全球文化成果的保护和传播。生成式人工智能可以在对文物艺术品进行三维扫描和数字化储存基础上,进一步利用图像生成技术重现内容,增强沉浸式的文化体验;还可以利用语音识别、语言合成、虚拟人等技术生成方言主播.使方言传播更加生动,帮助保护方言等非物质文化遗产。

生成式人工智能助推全球环境治理和可持续发展。生成式人工智能可以通过分析污染水平、地表变化以及气候变化的数据,比较分析人类活动对环境影响的程度,从而提供监测、限制和解决措施的建议,为减缓气候变化,保护森林、海洋及野生动物栖息地的可持续性做出贡献。

(四) 助力科学研究

生成式人工智能推动科研效率不断提高。生成式人工智能开始在科学研究中发挥愈发重要的作用,通过人机协作大幅加快科学研究。生成式人工智能可以辅助进行材料收集、分析论证、论文撰写等学术研究的基础性工作,将科研人员从非核心的研究工作中解放出来。例如,生成式人工智能学术助手可以通过结论提炼、方法总结、观点总结、文献综述以及摘要汇总等功能,方便科研人员完成学术文献的结构化、系统化阅读,快速掌握研究基础、发现科研选题方向以及设计研究方案。

生成式人工智能助力不同研究方向纵深探索。生成式人工智能基于深度学习技术可以充分发挥神经网络高维逼近的强大优势,有望解决所谓的“维数灾难”,从而加速重大科学问题研究和知识发现。在分子结构方向,生成式人工智能可以加速从分子设计、反应设计到条件生成、反应检验等化学合成全链条,帮助提升潜在功能性分子(如药物分子)及其合成方案设计的速度。在动力学方向,生成式人工智能可以用于流体粒子模型的计算与模拟,实现从外部视觉表观推理内部流体动态,并可反演粘度、密度等流体属性,在问题规模、模拟速度、模型泛化性、反问题求解精度等多个方面突破现有流体数值模拟方法的计算瓶颈。在生物医药研发方向,生成式人工智能支持跨模态自然交互,覆盖医药研发的流程场景,例如专家可以通过自然对话获取某一适应症的基本情况、药物研发进展等;支持生物医药多模态数据,例如输入分子式后可直接得到该分子的完整描述信息等。

图片

图片

图片

生成式人工智能引发的挑战

(一)技术内在风险引发安全隐患

生成式人工智能技术在迭代升级的同时也放大了技术安全风险。数据方面,数据投喂带来价值偏见、隐私泄露、数据污染等问题。一是训练数据固有偏 见导致模型产生偏见内容。全球科研机构的多个实验发现经过人工标注的大模型在应用中存在性别歧视、种族歧视等偏见问题。例如,根据微软发布的GPT-4研究报告,大模型在生成职业性别描述时,会进一步扩大数据集的固有偏差,存在严重性别偏向。二是海量训练数据扩大了数据安全和隐私保护风险。训练大模型依赖庞大的数据,对于数据来源的合法性审查带来了诸多挑战。此外,大模型也存在泄露用户输入数据风险。三星在启用ChatGPT的20天内就发生3起员工泄露数据事故,泄露内容包括半导体设备测量.良品率/缺陷、内部会议内容等敏感信息。三是人工智能生成数据将造成训练数据污染。如果使用生成式人工智能产生的数据作为语料训练生成式人工智能模型,可能会导致“模型崩溃”现象发生。剑桥大学学者指出,生成式人工智能在制造便利的同时也在摧毁互联网环境。

算法方面,算法模型生成特性及安全漏洞会引发“幻觉”(hallucination)或虚假信息模型遭受攻击等风险。一是生成式模型模仿特性生成“幻觉”或虚假信息。生成式人工智能基于训练数据进行模仿而非理解的特性,可能生成错误的、不准确的、不真实的信息,即生成“幻觉”内容。美新闻卫士公司用虚假信息数据库”中的100条提示词测试ChatGPT,其对 80 条提示词反馈了虚假和误导性信息25。二是算法模型安全漏洞诱发网络攻击风险。攻击者通过精心设计的输入操控,可能导致生成式人工智能后端系统被利用或被控制。甚至有黑客通过修改Web测试套件silverBullet的配置,大规模窃取了ChatGPT帐户27。OpenAl公司虽已发布最高奖励2万美元的“漏洞悬赏计划”,用于帮助发现并修补其产品的安全漏洞,但生成式人工智能恐将长期面临严峻的网络攻击风险。

此外,生成式人工智能的底层模型“根属性”诱发链路性风险。当前,生成式人工智能产业生态雏形初现,底层大模型成本高、投入重,形成了高技术壁垒和强竞争优势,其“根”基础设施属性得以牢固。中下游基于大模型底座开发部署的产品应用可能将固有风险进行链路性扩散。2023年2月,布鲁金斯学会报告指出,未参加生成式人工智能原始模型开发的“下游开发者”可能会将原始模型经过调整后整合到其他软件系统,由于双方均无法全面了解整个系统,或将增加这些软件错误和失控风险。

(二)人机关系变化加深科技伦理失范

生成式人工智能重构人机关系可能带来科技伦理失范。生成式人工智能强大的任务处理能力容易导致人的思维依赖。过度依靠生成式人工智能提供的答案,会使人自身的观察与理解、归纳与演绎、比较与推理等感知和逻辑能力缺乏训练,总于思考与创新。例如.很多学生开始依赖于生成式人工智能完成作业,美国北密歇根大学的一位教授在其课堂上发现了一篇优秀的调程论文,却是由ChatGPT生成9。生成式人工智能存在价值失焦或道德缺位,容易产生负面的机器诱导。在人类与生成式人工智能交互过程中,曾出现聊天机器人“情绪化”、“攻击性”等情况,甚至出现过诱导人类自杀,部分原因在于生成式人工智能道德缺位而做出与人类伦理价值相悖的不利诱导。生成式人工智能表 现出强拟人特征,进一步冲击人的主体性。在人际关系方面,人机交互愈发频繁,使人产生情感依赖,消弭 真实的社会交往。在人机关系方面,生成式人工智能由浅至深地替代人的各种机能,冲击现有的劳动分工体系,可能使人成为机器支配的对象。

(三)技术跃迁引发人类社会发展挑战

生成式人工智能凸显发展的不均衡,拉大发展差距。对于许多语种来说,可供训练模型的文本非常有限,例如阿拉伯语全球使用人口虽然超过4.2亿,但软件应用程序中阿拉伯语资源和工具的供应远不及英语等语种0。语言数据较少的国家或人群发展生成式人工智能将受到较多限制。生成式人工智能发展可能扩大教育不公平,加深教育领域的数字鸿沟,生成式人工智能的应用对硬件设施和数字素养有着较高的要求,经济条件的差异可能加剧地区和群体之间的教育资源差距,导致不平等的学习机会31。生成式人工智能冲击劳动与就业结构,加剧社会分化,据高盛研究,在创造新岗位的同时,生成式人工智能可能会取代全球3亿人的工作岗位22,密集型劳动力面临被替代的风险产生更多“无用阶级”,社会阶层分化将更为明显。生成式人工智能可能影响生态环境,模型训练的计算和环境成本与模型大小成正比,如果消耗大量能源进行重复训练.不仅导致资源的浪费,也抬高了碳排放水平。有研究人员指出,1750亿个参数的GPT-3模型能耗相当于1287兆瓦时的电力,同时还产生了552吨二氧化碳33。此外,生成式人工智能正在冲击知识产权制度,生成式人工智能是否能作为作者、是否具有可版权性等问题尚无定论,未经授权或者未按开源许可的要求使用文章或代码都可能侵犯知识产权。

图片

图片

图片

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值