AI大模型在各国政务领域应用深度研究报告 2024

当前,生成式人工智能大模型成为各行各业关注重点和热议话题。以 ChatGPT、Bard 为代表的大模型是人工智能技术的一次飞跃,代表着 AI 技术从感知世界、理解世界向创造世界的跃迁。政务领域涉及大量内容生产及人与人交互环节,与生成式 AI 大模型高度的信息收集、文本总结、智能交互能力契合度较高,是未来生成式 AI 大模型应用的肥沃土壤。

自大模型工具出现以来,全球各国纷纷探索新技术在政府治理中的应用可能,推动形成一波以智能化为主要特征的数字政府改革浪潮。从应用广度看,大模型在政务领域的应用探索已较为普遍,包括美国、英国、澳大利亚、加拿大、新加坡、日本、韩国在内的 18 个国家或地区已将大模型应用在政府事务管理中,场景覆盖政府内部办公、政务信息公开、政务服务提供、民生服务优化和国防航天等 5 大领域 13个细分场景。

从应用深度看,部分国家在政务领域的大模型认知率、利用率达到较高水平,罗兰贝格咨询公司预计,在充分应用的前提下,预计大模型将推动公共服务行业降低 1.8%的经营成本。

从部署推进看,新加坡、日本、美国等实践较为靠前,已推动地方分散探索向集成应用转变,在部署方式、数据处理等方面做出统筹安排。为用好大模型技术这把“双刃剑”,各国积极推动组织、人才、技术等变革以适应新的治理挑战,同时加快政务领域大模型应用规范。

2023 年以来,韩国、新加坡、美国、英国、澳大利亚、新西兰、日本、加拿大、丹麦等 9 个国家相继出台政府机关(公务员)使用生成式 AI的临时指南,通过明确使用原则、框定场景范围、建立监管规范等规避技术风险,推动应用趋向合规。但由于技术尚处于快速发展阶段,治理政策的模糊性仍然存在:一方面尚未形成有关政府应用人工智能技术的完善风险治理框架;另一方面,场景分类分级和全流程监管规范较为粗糙,无法实现新技术应用行为的全覆盖。

我国政务领域大模型应用尚处于起步探索阶段。

经梳理统计,国内至少有 56 家大模型厂商在政务领域开展了布局,其中,百度、智谱华章、科大讯飞、商汤科技、中国科学院自动化研究所、阿里云、360 和昆仑万维等 15 家厂商的大模型产品通过备案。

北京、上海、杭州、深圳等地出台政策推动政务领域大模型应用落地,政务热线、智能客服、城市治理、医疗、教育是重点落地方向。

随着生成式 AI 大模型的快速发展,预计未来相关技术将广泛应用于各地智慧城市建设、政务服务提供中,成为推动新一轮治理变革的强大力量。政府机构需要强化前瞻部署,主动应对新技术变革带来的机遇和挑战,从战略、业务、组织、风险多个层面对大模型技术形成充分认知,加快探索适合我国的政务大模型开发和应用可行路径,加速政府治理现代化。

一、AI 大模型带来政府治理变革新机遇

当前,人工智能领域科技创新异常活跃,日益成为改变世界竞争格局的重要力量。一批里程碑意义的前沿成果陆续突破,以 ChatGPT为代表的大模型技术引发通用人工智能新一轮发展热潮。凭借强智能性、强通用性、强交互性优势,大模型与交通、医疗、工业等传统行业深入融合,成为进一步推动产业发展和治理变革的关键力量。

在工业领域,大模型实现汽车、建模等设计的自动优化,通过物流、安防实现智能化管理;在医疗领域,大模型实现蛋白分子的结构预测,辅助医生影像读片与分析病例报告,推出 AI 陪护与交互式心理咨询;

在金融领域,大模型催生了数字员工,借助 AI 客服、AI 投资顾问、AI 财务实现服务的自动化,并进一步优化投资管理与风险管理。

政务领域涉及大量内容生产及人与人交互环节,与生成式 AI 高度的信息收集、文本总结、智能交互能力重叠较高,是未来大模型应用的肥沃土壤。一方面,政府应用人工智能技术具备良好基础。

IDC数据显示,2022 年中国人工智能政府行业应用渗透度为 52%,仅次于互联网行业(83%)和金融行业(62%)。1据国家发展改革委官方披露,我国政府数据资源占全国数据资源的比重超过 3/4,将为大模型训练和持续更迭提供丰富的基础燃料。2另一方面,随着数字政府建设深入,政务服务的普惠化便利化水平不断提升,线上线下服务量随之激增,迫切需要运用新的技术手段解决政府回应能力不足问题。以 12345 政务服务热线为例,2020-2022 年北京市受理群众热线反映分别为 1104、1485、7592 万件,三年增长 588%,其中,简单的咨询答复类热线 2022 年占比达 88%。利用生成式 AI 智能交互、文档制作等核心能力,能大幅缓解超大城市热线咨询激增带来的服务压力。

AIGC 时代数字政府建设也将面临新的变革机遇。

其一,改变现有人机互动模式,推动“互联网+政务服务”向“智能+政务服务”演进升级。在服务需求端,通过拟人化交流、类人化互动,大模型能够增强问询系统对用户自然语言和问询上下文的理解能力,自动精准抽取用户需求,提高回复准确性和办事成功率;在服务供给端,能够实现对服务引导、咨询等重复性工作的取代或智能辅助,大规模替代和优化政务服务前端人力劳动,减轻服务压力。

其二,革新内容生产方式,实现会议记录、文书撰写等部分行政活动的自动化替代,消解不必要的行政负担,让政府人员尤其是基层人员从“繁文缛节”中解放出来,投入到前瞻性、全局性、创新性的工作之中,更多地扮演回应复杂问题的综合协调者和最终决断者。

其三,形成“模型即服务(MaaS)”的新型服务形态,与传统的 IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(应用即服务)一起成为政务云平台的构成要素,共同为“一网通办”“一网统管”“一网协同”等上层政务应用系统赋能,改变现有数字政府建设格局。

二、全球掀起政务领域大模型应用浪潮

(一)探索推进较快,应用前景广阔

自以 ChatGPT 为代表的大模型工具出现以来,全球各国纷纷探索新技术在政府治理中的应用可能,推动形成新的一波以智能化为主要特征的数字政府改革浪潮。

从应用广度看,生成式 AI 大模型在政务领域的应用探索已较为普遍。截至 2023 年 10 月,已有美国、葡萄牙、英国、爱尔兰、丹麦、澳大利亚、加拿大、阿联酋、卡塔尔、以色列、新加坡、日本、韩国、印度、马来西亚、柬埔寨等 18 个国家或地区将大模型应用在政府事务管理中。在应用层级上,既包括当地中央政府部门,也包括地方机构,如美国联邦政府机构总务管理局、华盛顿州政府、波士顿市等同步推进大模型技术应用,日本中央政府部门农林水产省、一级行政区划东京都、地方政府横须贺市等也均在政府办公中使用 ChatGPT 等大模型工具。在应用场景上,覆盖了文本生成、服务提供、决策分析到科研创新等多类场景,大模型作为辅助工具融入到政府活动的方方面面。此外,也有个别地区或部门出于数据安全风险等原因颁布指令,有期限地禁止公务人员使用大模型工具,如美国环保局、缅因州政府等。

表 1 各国(地区)政府对大模型技术的应用情况

从应用深度看,大模型在政务领域的认知率、利用率达较高水平,应用前景广阔。人工智能研究公司 Goatman 发布的调研数据显示,50%以上的日本都道府县政府在使用 ChatGPT。

日本野村综合研究所开展的网络问卷调查显示,政府部门对 ChatGPT 的利用率达 17.5%,仅次于信息通信业(32.8%)和制造业(19.2%)。5针对加拿大公共服务部门 1320 名公务员的调查显示,11%的公务员在工作中使用过ChatGPT、Bard 等 AI 大模型工具。6著名管理咨询公司罗兰贝格(Roland Berger)预计,生成式人工智能大模型落地的第二波就是教育、通信、公共服务等行业,这些行业虽然信息化投入相对较少,但生成式人工智能技术带来的价值空间广阔。在充分应用的前提下,预计大模型将推动公共服务行业降低 1.8%的经营成本。

图 1 生成式人工智能的产业影响波次顺序

从部署推进看,新加坡、日本、美国等实践较为靠前,已推动各地分散探索向集成应用转变。部分国家深刻认识到大模型技术对政府治理的变革性影响及其突出的安全风险隐患,开始尝试在部署方式、数据处理等方面做出统筹安排,以提升政府对新技术的集成应用能力。

日本数字厅与微软合作,在政府数据中心设置 AI 大模型产品使用的高处理能力设备,以处理政府机密信息;新加坡设置 AI 创新沙盒,为公共部门提供预训练的生成式人工智能模型和初级代码开发工具。部分大模型厂商适应政府集成应用需要,提供面向政府侧的定制化服务能力。

微软先后和美国、日本政府达成合作,向其提供通过微软Azure 智能云平台调用 ChatGPT 的服务;埃森哲发布专供美国联邦政府机构使用的 FedGPT;韩国互联网巨头 NAVER 为阿拉伯国家等提供符合其文化背景 AI 大模型。

(二)覆盖场景丰富,技术潜能初现

从各国(地区)实践看,大模型技术已在政府内部办公、政务信息公开、政务服务提供、民生服务优化和国防航天等 5 大领域 13 个细分场景落地。应用场景从政府内部扩展至对外服务及治理,从简单办公延伸至智慧民生建设,且部分场景取得了良好应用成效。

表 2 大模型在政府治理中的应用场景分布

1. 辅助政府内部办公

一是辅助知识检索与收集。

基于庞大的训练数据,大模型可根据提示瞬间收集大量信息,深度学习算法还可使大模型对信息进行分类和聚类,实现对分散信息的组织和总结,为公务人员提供匹配度高、整合度高的信息,成为公务员的“智能问询助手”。具体来看,公务人员可使用大语言模型等工具开展资讯收集、政策研究、招投标标准了解等方面的知识检索。例如,爱尔兰农业部利用 ChatGPT 检索处理技术和软件有关问题。英国、韩国和澳大利亚推荐其政府工作人员

在政策调研、信息收集中使用 ChatGPT 等工具。

日本横须贺市公务员使用 ChatGPT 检索信息,以获得业务灵感和政策建议。调查结果显示,横须贺市政府中 30.4%的公务员将 ChatGPT 应用于知识检索,是使用占比最高的场景;54.3%的公务员认为,知识检索功能为其提供了传统方法无法提供的信息和创意。

横须贺市还利用 ChatGPT 开发并上线了面向其他政府部门的问答系统,以供其他城市查询和了解本市政府 ChatGPT 的使用情况。

日本千叶县开展的生成式人工智能应用调查结果显示,约 70%的公务人员认为使用 ChatGPT 等大模型工具能提高其业务效率,其中,九成的公务人员认为,效率提高最明显的场景是创建 VBA 和编程代码知识。

二是助力内部文书写作自动化。

政府公文写作是内部事务中任务量大、机械性高、有“模板”可循的事项之一。大模型及其衍生产品在经过高质量语料库训练后,能胜任内容校对、资料整合、摘要总结等任务,还能按照指定框架、指定模板输出文本信息。将大模型工具应用于政府公文写作中,能将公务员从繁复的文案工作中解放出来,使其更加投入到创造性的工作中。目前,大模型已被用于政府简报、报告、会议纪要、邮件等各类应用型文书写作中。例如,新加坡开源科技部开发 Pair 公务员文书写作系统,可在几秒钟内整理大量咨询,撰写电邮及政府报告初稿,再辅以工作人员修改。数据显示,在试运行阶段,Pair 系统服务了 100 余个政府机构的超 11000 名用户,周活跃用户超 4500 名。9美国众议院将 ChatGPT 主要应用于内部办公中创建和总结文本内容,包括总结演讲信息、撰写政策文件及法案草稿等。日本政府与微软达成协议,微软将为日本数字厅等部门提供大模型工具,主要用于统计分析政府数据、提供政府官员对议会质询的答复草稿等场景。此外,日本横须贺市和东京都、中国台湾省花莲县、柬埔寨数字政府委员会等地区或部门均已将 ChatGPT 应用至政府内部文书准备中。

图 2 新加坡 Pair 公务员文书写作系统

2. 助力政务信息公开

区别于面向政府内部公务人员的场景应用,大模型应用于政务信息公开是指借助大模型类工具,面向群众输出政府意图或信息。此领域的应用不仅依托于大模型的自然语言处理能力,大模型所具备的多语言、多模态能力也有助于政府扩大信息受众范围、丰富信息公开形态。此外,大模型类工具能根据指定语气和风格输出内容,可帮助政府转化为群众站位,输出符合群众需求且简明易懂的信息,提高政务信息群众接受度和理解度。目前,大模型在撰写公开新闻稿件、政策文件简化改写、生成政府宣传物料三类细分场景中得到有效应用。

一是撰写公开新闻稿件。

例如,2023 年 4 月 18 日,日本横须贺市政府官网发布题为《地方政府尚属首次!横须贺市政府开始在全市范围内演示 ChatGPT 的使用》的公开新闻,且在新闻内容中明示“该新闻由 ChatGPT 撰写,工作人员仅进行部分校对与润色”。中国台湾省花莲县使用新闻科专属封闭资料库对 ChatGPT 进行微调,用以产出活动类新闻稿,每篇新闻稿撰写节省时间约为 15 分钟。美国众议院数字服务团队称,ChatGPT 将在众议院中应用于生成选民回应草案和新闻文件。

图 3 日本横须贺市发布由 ChatGPT 撰写的新闻

二是简化或改写官方文件。

例如,日本农林水产省使用 ChatGPT更新监管文件,该机构每年需修订上千页监管文件,ChatGPT 的引入大幅降低了文件修订的负担。该机构还使用 ChatGPT 简化补贴申请等在线操作指南,以帮助群众顺利完成业务申请。福岛县政府将ChatGPT 运用于创建县计划的摘要和儿童版本。美国波士顿政府将简化文本写作、多语种文本写作作为大模型技术的推荐使用场景,以进政府信息面向不同年龄、不同受教育水平、不同语言的人群的公开。

三是生成政府宣传物料。

例如,日本北海道当别町、神奈川县横须贺市等地使用 ChatGPT 制作政府宣传文案。茨城县将 ChatGPT 融入县政府认证的虚拟旅游网络达人“井原日和”中,增强群众与虚拟人互动的乐趣,提升该县旅游吸引力。美国众议院使用 ChatGPT 为政府品牌宣传生成 Logo 图案。波士顿还将政府宣传海报、视频、歌曲等的制作作为推荐使用案例。

3. 优化政务服务交互

大模型类人化的对话交互能力可重塑政府为用户提供服务咨询和业务办理的模式,已有实践主要体现为政务服务问询系统的优化升级上。问询系统是政府为群众和企业提供服务最前端、最重要的环节,传统政务问询系统仅支持“一问一答”,需要用户使用特定词汇或专业性语言触发回复,且回复宽泛、办事指引不够直接精准。大模型技术与政务问询系统结合,能够提高问询系统对用户自然语言和问询上下文的理解能力,自动精准抽取用户需求,提高回复准确性和办事成功率。多轮对话交互还能助力政务问询系统实现业务办理全程引导和协助,打造“对话即服务”“平台即助理”等政务服务提供模式。

目前,大模型技术已在问询系统中的政务热线电话、政府门户网站问答机器人以及专业领域政务知识问答系统等三类细分场景落地。

一是助力政务热线智能化。

例如,韩国首尔市 120 茶山呼叫中心计划将 ChatGPT 应用于其城市咨询热线中,推动违规信息举报、信访处理和咨询等事务的全自动化。葡萄牙政府正在测试基于 ChatGPT的新人工智能系统,用于 112 政府紧急热线的接听答复、问题评估、工单派发等环节,以期缩短电话响应时间,提高接通率。

二是打造政府服务智能助手。

例如,阿联酋迪拜水电局将ChatGPT 嵌入到聊天机器人中,为用户提供 7×24 的服务支持,可提供账单查询、停机更新和服务请求等业务咨询。卡塔尔通信和信息技术部将 GPT 技术嵌入到国家政府门户网站 Hukoomi 中,以改善用户体验,提高服务效率。阿联酋电信和数字政府监管局在政府网站中使用 ChatGPT 为中小企业提供网站域名推荐服务,企业可通过对经营业务的描述获取以“.ae”为后缀的阿拉伯语或英文域名。阿联酋国家政府门户网站也将 ChatGPT 嵌入到其问询系统 U-ASK 中。新加坡政府科技局基于政府文档资料形成知识库并链接至谷歌和微软提供的大语言模型上,已将 21 个政务服务聊天机器人转化至大语言模型驱动的引擎上。

此前工作人员必须手动开发多达 10 到 15 种不同的提问方式来触发同一问题的关键词,而借助大模型的自然语言处理和人类反馈强化学习能力,此过程得以简化,节省了训练、维护和更新聊天机器人所需的人力和时间。

该部门计划于 2023 年底将所有政府聊天机器人转移至大语言模型驱动的引擎上。马来西亚科技创新部称,正在将 ChatGPT 嵌入政府服务中,以处理公众咨询。美国纽约市政府通过推出 MyCity 门户网站,将 AI 技术应用于帮助家庭获取儿童看护服务,并推出首个 AI 聊天机器人试点项目,帮助企业主和创业者更便捷获取纽约市政府网站信息。

专栏 1:迪拜水电局借助 ChatGPT 提升虚拟人工智能员工 Rammas 的技能

2023 年 2 月,迪拜水电局子公司 Moro Hub 与微软合作,宣布将使用ChatGPT 技术增强服务,对原有虚拟人工智能员工 Rammas 进行升级改造,迪拜水电局由此成为全球首个使用大模型技术的政府部门。

与 ChatGPT 集成后,一方面,Rammas 数据学习、理解分析客户询问的能力得到提升,能更为及时准确地响应用户需求;另一方面,在大模型加持下,Rammas 还能根据用户的使用行为习惯和偏好,为其提供定制化的答案。此外,它还能分析数据,如传感器、电表和天气预报等,为水电局的运营提供基于数据驱动的建议。

数据显示,自 2023 年 4 月底到 2023 年 6 月末,ChatGPT 支撑下的 Rammas 回复了32084 个查询,客户满意度达 90%。随着 ChatGPT 在政务咨询系统的应用成功,迪拜水电局将在更多的服务提供中利用大模型技术,助力其数字化转型。

三是支撑专业领域问询服务。

例如,印度电子信息技术部基于印度政府文件和当地常用 12 种语言对 ChatGPT 进行训练,同时接入语音识别软件,将 ChatGPT 嵌入到聊天软件 WhatsAPP 中,为不同语言背景、文化水平较低的农民、低收入者等弱势群体提供政府补贴支持相关政策和项目查询。葡萄牙政府利用大模型技术辅以法律专业知识训练,开发司法领域知识问答指南项目,向公民提供关于司法诉讼程序、证件办理程序等相关咨询服务。新加坡政府科技局将大模型技术引入 SupportGoWhere 政府援助申请网站中,居民可直接通过情况描述获得可申请的援助项目信息。

图 4 葡萄牙司法使用指南项目

4. 打造智慧民生项目

大模型在教育、医疗等民生领域中有着优异表现。OpenAI 官方称,ChatGPT-4 在 SAT 美国大学入学考试中数学成绩超越了 89%的人类考生。ChatGPT-4 和 Med-PaLM 2(谷歌开发的医疗大语言模型)均通过了美国执业医师资格考试。目前,多地政府将大模型技术用于优化教育、医疗、就业等三方面的民生服务。

一是助力打造智慧教育。

例如,台湾地区教育事务主管部门借助大模型技术和语音识别合成技术,开发 CoolE Bot 主题情景式英语聊天机器人,用于中小学生英语口语教学。台北市在其线上教育平台“酷客云”中利用 ChatGPT 开发了自动出题系统和 AI 助教老师,以降低教师负担、跟踪学生线上学习状态。台南市利 ChatGPT 研发出生成式 AI 辅助学习中介平台,具备提问引导教学、过滤不当信息、分析记录学习历程、即时诊断学习效果等功能,用以辅助师生进行编程、英语、文艺创作等相关学科的教学。印度政府使用全国教师平台DIKSHA 的课程储存库对 ChatGPT 进行训练,再结合在线翻译软件为学生打造本地语言课程知识获取平台,以促进地方教育民主化。

二是提升医疗卫生服务智能化水平。

例如,美国卫生与公共服务部艾滋病防控网站(HIV.gov)利用大语言模型处理分析来自疾病控制与预防中心的数据信息以辅助决策。新加坡卫生部直属卫生信息系统公司新联科技 Synapxe 借助微软 Azure 云中的 GPT 工具,开发面向医疗保健人员的专业 GPT 平台,为患者用户提供疾病护理方案,帮助医生跟踪患者用药情况和健康状态变化。

三是提供就业指导服务。

大模型具备强大的数据分析能力,能够将求职者个体特征与用人方职位要求进行精准匹配,还可进一步分析就业市场数据,为政府就业政策制定提供可靠数据支撑。例如,新加坡劳动力局利用 ChatGPT 和开源框架,打造了职业助手,不仅能实现求职者和岗位的双向精准推荐,还能针对岗位为求职者生成个性化简历摘要。

5. 强化国防科技实力

美国已探索大模型技术在国防安全、航空航天两类重大国家科技创新项目中的应用。美国国防部持续推进对大模型在国防安全领域应用的监测和探索。2023 年 1 月,美国国防部信息系统局将生成式人工智能技术列入 2023 年年度技术观察名单中,以提高国防部对新技术在改善情报、作战规划以及行政业务流程等方面潜力的认知。6 月,五角大楼称,正在联合学术界和企业界,共同训练开发为国防部专门定制的多模态大模型系统。同时,国防部在其“全球信息主导地位”实践中对多种生成式人工智能模型开展测试,旨在借助新技术提升美军联合全域指挥与控制作战结构的能力。8 月,美国海军陆战队系统司令部推进开发专用大模型聊天机器人,以提升其决策支撑系统的能力。NASA 正在开发类 ChatGPT 的航天 AI 助手,不仅可为宇航员提供对话式操作指引,还可提高航天器故障检测和修复效率。此外,NASA员工也正在测试和评估 ChatGPT 在代码编写和研究总结等方面的可行性、准确性和成本等。

(三)部署方式多元,尚无统一路径

由于风险接受程度、政府创新传统、国情政策等因素不同,各国政府在大模型部署方式上存在差异,尚未形成统一模式。基于数据安全性、算力稳定性、部署成本等因素考量,大致可将目前主要国家的部署方式分为三类:订阅付费、定制化部署和打造政务专属模型。

1. 订阅付费

订阅付费指政务机构或公务人员直接访问公开的第三方 AIGC平台,或通过企业服务调用市场成熟大模型产品。以日本为代表的个地区采取订阅付费模式。日本农林水产省、美国众议院、柬埔寨数字政府委员会、英国、丹麦、以色列、加拿大等允许其公务人员直接将 ChatGPT 应用于日常办公事务处理。2023 年 6 月至 7 月,微软先后和美国、日本政府达成合作,向其提供通过微软 Azure 智能云平台调用 ChatGPT 的服务。

采用订阅付费模式可以降低政府财政投入,加快新技术赋能政府治理变革的速度,但同时弊端突出。

一是安全风险较高,市场既有大模型平台或工具本身尚存技术漏洞,数据安全事故时有发生,政府信息机密性极强,不当使用行为更易引发数据泄露、隐私侵犯等重大风险。

二是个性化服务程度较低,已有大模型训练语料库主要来源于维基百科、社交媒体平台等公开数据,政务专业知识占比较低,模型能力与政府机构治理活动贴合不紧密,政务应用场景较为有限。

2. 定制化部署

定制化部署指在通用大模型底座基础上,结合政务领域数据和知识库进行训练与微调 13,并部署在政府专有服务器上,以提升回答专业性及数据安全性。以新加坡为代表的 9 个国家或地区采取定制化部署模式。

马来西亚、阿联酋、卡塔尔、韩国、美国等将 ChatGPT 嵌入到已有政务服务系统或政府门户网站中,利用大模型技术提升政务系统个性化服务能力。新加坡、印度、葡萄牙等则利用大模型技术能力,开发政府办公、民生服务等场景专用软件,提升政府服务效能、优化群众服务体验。

定制化部署较订阅付费模式的安全性和个性化程度均有提升。

一方面,应用场景更加贴合政务领域,由通用知识问答、公开文本生成延伸到政府文书写作、政务服务问答、法律政策咨询等场景,场景个性化程度提升。应用场景的深化意味着政府需针对相应场景,利用政务数据对模型进行微调。例如,印度电子和信息技术部开发的弱势群体政策咨询系统、葡萄牙司法部开发的“司法实用指南”、新加坡政府科技局的大模型聊天机器人项目等均使用了政府数据进行模型调整。

另一方面,大模型对政府信息的获取程度加深,促使政府采取措施降低安全风险。通常采取三种方式推动数据安全:

一是设置专属设备,如日本数字厅与微软合作,在政府数据中心设置 AI 大模型产品使用高处理能力设备,以处理政府机密信息。

二是数据独立储存,如新加坡、美国等在使用大模型工具时,将数据储存于政府云端并设置保密协议,确保数据不被企业获取。三是设置安全测试环境,如新加坡设置 AI 创新沙盒,为公共部门提供预训练的生成式人工智能模型和初级代码开发工具,机构可以在专属的云环境中构建和测试自己的AI 解决方案,实现风险可控。

3. 打造政务专属模型

政务专属模型指基于领域专有大数据集从 0 开始构建内部生成式人工智能体系,打造适用于政务领域的专属大模型,一般需要强大的资金实力和研发人才支撑。目前仅美国国防局、NASA 宣称采用第三种模式,但尚未实现落地。

美国国防部称,五角大楼不会购买现成产品或依赖工业界提供解决方案,而是使用国防部数据,训练定制系统。NASA 也声称在自主研发航天器使用的专属人工智能模型。专属大模型由政府主导进行训练开发,所有环节均由政府进行把控,符合安全合规要求。

但同时,可能带来较高的开发成本,专属数据的训练也可能使大模型涌现能力和泛化能力不足,智能化程度有一定折扣。总的来看,采用哪种部署方式与国情政策、文化背景、技术实力、部署成本等密切相关。以日本为例,两方面因素推动其采取订阅付费模式。

一是新冠疫情暴露出日本数字社会建设水平低的严峻问题,倒逼政府加快对新技术的接受和使用节奏。

二是高龄少子化国情致使日本面临劳动力不足的困境,亟需在各个领域借助大模型等自动化工具,降低劳动力成本。采用定制化模式的政府前期一般已经形成了良好的部署条件或发展基础。如印度政府正在推进“数字印度”项目,着力为边缘化群体提供服务,ChatGPT 的嵌入有助于推进该项目落地。美国、新加坡、韩国、阿联酋、葡萄牙、马来西亚的电子政务发展指数均处于非常高水平 ,具备定制化部署的制度环境和基础能力。

(四)配套措施全面,力度持续强化

为适应新一轮技术变革需求、有效赋能政府治理提升,主要国家均大力推动政府组织、人才、资金等改革,完善配套措施。

1.明确应用探索的专责团队大致有两种应对情形:一种是明确主管部门,一般由国家政府数字化转型及技术创新的主管部门负责推进大模型应用。例如,英国明确由中央数字和数据办公室和科学、创新与技术部,负责探索大模型技术的用例、风险和机遇;澳大利亚明确由数字化转型局、科学和资源部负责探索使用人工智能新技术相关的政府政策和标准。另一种是组建专门团队,加速技术推广使用。例如,日本东京都成立项目组,负责测试 ChatGPT 使用效率,探讨并制定政府大模型技术使用指南。

美国众议院成立人工智能工作专组,以在国会办公环境中测试和共享诸如 ChatGPT 等新的人工智能工具。美国国防部成立 AIGC 工作组Lima,负责在整个国防部范围内“评估、协调和使用”AIGC 技术。

美国白宫总统科技顾问委员会(PCAST)成立了一个生成式人工智能工作组,以帮助评估联邦机构使用生成式 AI 的关键机遇和风险,并就如何更好确保技术开发和部署提供意见。

专栏 2:美国国防部成立 AIGC 工作组 Lima

2023 年 8 月 10 日,美国国防部宣布成立了一个专门研究生成式人工智能工具的新工作组——“利马特别工作组”(Task Force Lima)。“利马特别工作组”隶属于美国国防部的首席数字与人工智能办公室(CDAO),负责在整个国防部范围内“评估、协调和使用”生成式 AI 技术,以最大限度降低这种技术构成的潜在风险。9 月 27 日,美国防部 Lima 工作组表示,将在未来 18 个月内充分了解军方和国防部对于生成式 AI 技术的需求,以加快对该技术的理解、评估、部署及监测,大规模整合具备任务适应性的相关技术。Lima 工作组的工作包括:

①全面了解人工智能的工作原理和外部数据应用过程,并聚焦军事用例与作战过程的联系,与其他部门合作,训练多个种类的大语言模型;

②为国防部制定基于生成式 AI 的临时指南、框架和工作流程,参与国防部对大语言模型的实际研究和部署;

③建立周例会、月度会议和季度会议机制,让内部各级人员及时了解 Lima 工作组正在制定的计划和方法;

④向业界发布信息征询书,了解和探索创新型人工智能的开发与集成风险和收益。

2.提高公职人员人工智能素养

普遍采取两种方式:

一是在政府部门引入第三方技术力量。例如,英国内阁办公室计划从私营部门借调数据和人工智能专家,同时组建一支负责政府自动化技术创新的公务员团队,解决政府技术技能短缺问题。

二是加强公务人员新技术认识和使用能力培训。例如,美国新泽西州、加利福尼亚州等四州联合成立 InnovateUS 组织,旨在通过培训提升公务员生成式 AI 使用技能。新加坡为公务员提供 ePrimer 培训课程,通过视频和实际案例资料,提升公务员对 AI 新技术的认知。此外,迪拜、中国台湾等地区也开展了面向公务员的 ChatGPT 技能培训。

3.增强技术创新和应用能力

一是加强大模型技术投资和研发支撑力度。例如,日本数字厅计划每年花费 3.3 亿日元(约合 235 万美元)以在政府部门中使用并推广 ChatGPT。日本经济产业省引进尖端超级计算机,促进 AI 大模型赋能各个领域。韩国政府已经开放 15 亿条数据,涵盖制造、教育、金融、自动化、体育等 14 个领域供 AI 训练使用。

二是打造技术应用的社会氛围。例如,日本户田市举办创新大赛,促进公职人员、公民和企业共同参与探讨 ChatGPT 在市政运营中的安全使用。澳大利亚举办政府生成式人工智能峰会,邀请各界专家参与,解答政府机构如何使用新技术的紧迫问题。

三、各国加快政务领域大模型应用规范

大模型的应用是一把“双刃剑”,在推动政府治理变革的同时,也带来多方面安全风险。为应对这一变革冲击,各国(地区)政府在推进应用的同时,同步出台政府机构使用生成式 AI 的相关规范,着力实现新技术应用的安全、向善、可信、可控。

(一)发布临时指南,使用趋向合规

截至 2023 年 10 月,已有韩国、新加坡、美国、英国、澳大利亚、新西兰、日本、加拿大、丹麦等 9 个国家出台了政府机关使用生成式AI 的专项治理规范。美国、日本的部分地区还出台细化规范或要求,指导当地公务员合理使用 AIGC 新技术。政府对人工智能工具的使用趋向合规。

从出台背景看,各个国家或地区普遍认同 AIGC 技术将为政府机构提供诸多潜在好处,出台政策旨在最大限度释放新技术应用潜力,鼓励地方机构探索更多用途。但同时,AIGC 技术的迅速发展及在公务员群体的广泛流行,也带来了诸多不确定性风险,迫使政府不得不在短时间内制定临时性政策。西雅图市指出:“AIGC 在短时间内变得非常流行和普遍,公务员可能很有兴趣使用此类系统开展城市治理,其潜在政策影响和风险尚未充分了解,本临时政策旨在最大限度减少技术使用可能出现的问题。”加拿大政府也指出:“AIGC 作为一类新的技术尚处于不断发展阶段,潜在政策应用和风险不够明朗,不应在所有情况或场景中使用该技术,应将其使用限制在可以有效管理风险的活动中。”

从适用范围看,文件主要规范政府机关的内部使用行为。美国总务管理局将指南适用范围扩展至政府信息系统的承包商,波士顿市将适用范围扩展为公立学校外的所有城市机构和部门,圣何塞市要求所有政府相关人员(城市公务员、相关供应商、志愿者等)在工作中都需要遵循指南要求。

从有效期限看,各国或地区普遍将出台的指南作为临时性过渡政策,有效期多为一年或半年,或根据技术发展和应用情况持续更迭,体现了政策的灵活性和治理的敏捷性。从规范内容看,主要对政府机构使用生成式 AI 的风险、用例、规范做了提示或明确。从发布时间线看,各个国家或地区的政策内容相互借鉴,呈现逐步完善的过程。

2023 年 4 月 18 日,美国西雅图市率先发布全球首份适用于公共部门的生成式 AI 临时政策,对政府机构获得、使用 AIGC 技术及责任归属做了初步要求。5 月 18 日,波士顿市发布了首份临时指南,详细阐述了公共部门应用 AIGC 的目的、原则、示例及每个场景的详细操作规范。6 月,美国总务管理局、英国、澳大利亚集中发布相关政策规范,适用层级由地方上升至中央部门,内容上进一步明确了软件采购、安全测试、禁止使用场景等要求,同时细化各部门监管职责。

7 月,美国圣何塞市发布生成式 AI 使用协议,首次系统提出应用场景的分类分级方法。

9 月,加拿大发布联邦机构使用生成式 AI 的指南,除一般性风险外,还明确过度依赖人工智能可能会干扰行政判断、扼杀创造力、影响程序公平性等风险。

10 月 30 日,拜登签署《关于安全、可靠和可信的 AI 行政命令》,提出采取 3 项行动“确保政府负责任且有效地使用人工智能”,一是为各机构使用人工智能发布指南,制定保护权利和安全的明确标准,改进人工智能采购,加强人工智能部署;二是通过更快速、更高效地签订合同,帮助机构更快、更便宜、更有效地获取指定的人工智能产品和服务;三是加快招聘 AI 专业人才,作为由人事管理办公室、美国数字服务部、美国数字军团和总统创新奖学金领导的全政府 AI 人才激增计划的一部分,各机构将为相关领域的各级员工提供 AI 培训。

表 3 主要国家(地区)发布的政府机构应用 AIGC 指南

(二)厘清关键风险,提出管控原则

作为一项新的技术工具,将 AIGC 引入政府治理面临多重风险,各国重点聚焦讨论和解决以下四类问题:

一是隐私和数据安全。

政务数据具有高敏感性,极易因误用或滥用导致信息泄露。当前,隐私和数据安全问题已经成为各国政府推进大模型应用的首要关注风险。日本鸟取县于 4 月 20 日宣布,禁止在答询资料、预算编列以及制定政策上使用 ChatGPT,不允许公务人员的电脑连到 ChatGPT。美国众议院于 6 月 8 日就 ChatGPT 使用制定新规,仅允许议员使用付费版 ChatGPT Plus,因 Plus 版本提供“保护国会数据等重要隐私”的功能,同时禁止输入未公开文本内容。韩国国家情报院要求各部门公务员在使用 GPT 系统时,除公开信息不得输入其他数据。

二是无意识的偏见和歧视。

AIGC 工具可能生成歧视性或不具有代表性的内容,或者包含刻板印象(如与性别、种族和民族等多重交叉身份因素相关的偏见)。许多生成模型都是根据互联网数据进行训练的,这通常是生成偏差的根源。加拿大国际治理创新中心研究指出,ChatGPT 具有政治倾向,使用 ChatGPT 类工具进行政府治理容易导致政治价值观受到侵害。2023 年 3 月,美科技伦理组织向联邦贸易委员会投诉称,GPT-4 具有偏见性、欺骗性,易导致对边缘化群体的负面联想和有害的定型观念。6 月 9 日,美国两党参议员提出一项新法案,要求披露政府在教育、就业等领域关键政策制定中人工智能的使用情况,以避免政策歧视和偏见。

三是技术可信度和透明度。

研究指出,已有大模型训练语料库主要来源于维基百科、社交媒体平台等公开数据,专业知识占比较低 15,应用在政府治理活动很可能产生不准确、不连贯、不完整的内容。日本横须贺市对政府机关工作人员使用 ChatGPT 情况的调查显示,近一半使用者认为 ChatGPT 会出现不恰当答案,希望提高回复准确性。

图 5 日本横须贺市机关人员关于 ChatGPT 回复准确性的调查结果

四是技术依赖和影响程序公平。

过度依赖生成式 AI 工具可能会干扰公务员个人的自主权和判断力,强化自动化偏见,还可能导致公务员批判性思维能力下降,从而抑制创新和创造力,导致对政策分析不全面或不完整。此外,生成式 AI 模型的不透明性使得追踪和理解其输出结果变得困难,在政府机构有义务向公众提供行政决策(如拒绝福利政策)理由的情况下,可能破坏程序的公平性。当公众使用政府提供的生成式 AI 工具(如聊天机器人)查找信息或进行公共通信时,可能接收到不适当内容或错误信息,从而导致政府承担不必要的责任。

各国出台的临时指南,也着重聚焦上述四方面风险,提出相应的管控原则。

一是确保数据和隐私安全。

普遍要求禁止输入非公开、涉密及公民个人隐私信息。美国总务管理局禁止工作人员私自访问公开的第三方 AIGC 平台。澳大利亚和新西兰要求,禁用工具保存聊天记录的权限,以避免大模型从聊天记录中推断出政府信息或将记录用于二次训练。

二是避免偏见和歧视。

强调公共部门使用 AIGC 应有助于所有种族、年龄、性取向以及残障人士等人群的社会福祉,尽量减少技术弱势群体面临的风险,在部署系统之前持续测试数据、模型和输出中的偏差。

三是保障技术可信度和透明度。

普遍要求公务员对通过AIGC 得到的建议或决策进行验证及人工审查,不得将 AIGC 提供回复作为信息唯一来源。政府应用新技术若对公众产生影响,应当公开其使用过程,明确告知如何、何时、为何使用 AIGC 工具,以及如何解决潜在风险。四是降低技术依赖。强调公务员应当受过 AIGC 应用培训,了解工具的优点、局限,学习如何创建有效的提示并识别输出结果的潜在问题。对 AIGC 的使用应当有效支持组织业务需求,并非在所有情况下 AIGC 技术都是最佳选择。

表 4 主要国家(地区)关于政务领域 AIGC 应用原则

(三)框定场景范围,分类推进应用

AIGC 赋能政府治理活动广泛,从政策咨询、方案设计到服务提供,受众和业务流程不同,可能产生的效益及风险也不同。从各国经验看,大致都明确了场景分级分类的总体治理思路,但在一些复杂场景应用规范上仍存在分歧。

依据风险高低对应用场景进行分类。

一般采取三分法或两分法对场景分类。美国圣何塞市根据“信息泄露风险”和“不利影响风险”两大维度将应用场景分为中风险、高风险、不可接受风险三类(见图6)。加拿大将场景归纳为谨慎使用、可以使用、不适用 AIGC 技术三类。英国内阁将场景分为一般示例、专业示例、不当示例三类,一般示例指使用生成式 AI 进行研究、总结信息等,专业示例指开发代码、文本数据分析等复杂场景。

澳大利亚简单分为低风险情形、不可接受风险情形两类,后者主要包括:需输入大量政府数据或机密、敏感信息,提供服务或做出决策,输出用于政府系统的代码等。从划分结果看,不管是两分法还是三分法,主要考虑的都是信息泄露风险和不利后果风险两大维度,不利后果包括歧视、决策偏差、输出信息不准确等。此外,韩国、美国波士顿市、华盛顿州等地仅列示推荐使用的场景清单,未对场景做出限制。

图 6 AIGC 在公共部门应用的风险矩阵

普遍强调不允许直接利用 AIGC 工具开展公共决策。加拿大政府认为,现阶段生成式人工智能可能不适合用于行政决策,因联邦政府无法确保 AIGC 决策的透明度、问责制和公平性。澳大利亚、美国圣何塞市强调,运用 AIGC 直接提供服务或做出决策,可能会改变个人或社区的权利、自由及获得服务的机会,构成不可接受风险。2023 年以来,美国多个州表达对政府机构使用生成式 AI 进行自动化决策偏见的担忧,并提出法案,要求政府工作者遵循负责任的人工智能采购和实施实践。同样,OpenAI 的使用条款指示用户,不要在有关信贷、就业、教育机构或公共援助服务的决策中使用 ChatGPT。谷歌禁止其生成式人工智能产品的用户“在影响物质或个人权利或福祉的领域做出自动决策”。

在翻译、编码、语音生成等场景应用上,各国态度存在分歧。

在翻译场景,圣何塞市认为,现阶段 ChatGPT 等大语言模型并不比Google Translate 等专业的翻译软件更适合翻译,其性能还有待专业人员进行评估,因此禁止直接使用 ChatGPT 进行工作文档的翻译。其他国家或地区对该场景限制较少。在编程场景,英国、加拿大、美国总务管理局认为可以用 ChatGPT 等工具开发代码,用来创建网站前端界面等,并要求人工审查其准确性、功能有效性、安全性等。

日本东京都政府接受宏、VBA 等低代码生成。澳大利亚、新西兰、美国圣何塞市则认为,使用大模型开发用于政府系统的代码是不可接受风险,因为生成的代码可能是过时的、受版权保护的或存在漏洞的,但可以用来检查代码漏洞。在语音生成场景,圣何塞市禁止政府在公务活动中通过 AI 生成音频,因为在任何城市文件或录音中使用人工智能复制一个人的声音,可能会损害工作人员和居民对政府的信任,同时存在潜在的法律问题。其他国家和地区对该方面限制较少。

(四)建立使用规范,形成监管闭环

各国从制度机制、部署环境、使用行为等方面明确 AIGC 应用规范,力图形成覆盖各环节各主体的监管闭环。

制度机制方面

一是实行事前审批或报备。

英国、澳大利亚要求公务员使用政府工作邮箱在 AIGC 平台注册账号,账号使用需由首席信息安全官或数据官审批。圣何塞市要求市政员工每次使用 ChatGPT、Bard 或 Midjourney 等工具时,都要填一份登记表,进行报备。日本东京都政府要求,职员在使用前必须填写使用申请表,经过批准后才能使用,在使用前还应进行在线学习,掌握正确的使用方法。

二是使用前开展安全风险评估。

日本东京都政府在推广使用 ChatGPT 前开展了有效性验证,澳大利亚、新西兰要求将技术应用到具体场景前开展安全风险评估。

三是建立风险追踪和问题反馈机制。

美国、英国、澳大利亚等要求,使用者需定期向主管机构报告使用过程的例外情况。美国总务管理局通过互联网通信流量监控,掌握政府部门对 AIGC 平台的访问情况,并建立适当的网络安全防护能力,实现受控访问。

部署环境方面,除少数国家或地区外,大部分不禁止政府机构直接使用公开的 AIGC 工具开展工作,只要满足相关使用规范即可。新加坡要求在专属云环境中构建和测试公共部门的 AI 解决方案,实现风险可控。美国总务管理局要求采取本地化部署方式,并进行专门的评估和授权才可以使用 AIGC 工具。西雅图市要求,所有软件服务必须经过政府采购流程,以确保软件服务经过必要的审查,员工使用生成式 AI 服务,必须提交软件服务中心购买需求,获得部门批准。东京都政府要求职员通过 Microsoft 的“Azure OpenAI”服务来使用ChatGPT,并要求服务器停止处理个人数据,以此来降低系统导致的数据泄露的风险。

使用行为方面,大部分国家和地区都详细列示了公务人员使用AIGC 工具的“可以”和“不可以”行为列表,大致包括四方面要求。

一要明确和细化指令,正确掌握 AIGC 工具使用技巧,如利用 AIGC简化官方文件时,在提问中给出明确的文件受众,让答案输出更符合要求。

二要对输出结果进行人工核查,如转化文本时,可通过其他工具进行可读性验证,在文本摘要生成时,需要人工核对整篇文章,确保没有遗漏重点信息。三要做好交互过程记录,以便公开使用行为,并支撑后续内部研究和使用情况统计。四要对所有生成内容进行标注,包括使用的生成式人工智能系统的名称,以及该内容是否经过事实核查,若在视频中使用 AIGC,需要将使用情况标注到每一帧。

图 7 公务人员使用文本生成 AI 的提示技巧

四、我国政务领域大模型技术应用进展

(一)整体尚处起步探索阶段

ChatGPT 带来的巨大冲击,燃起国内企业对 AIGC 赛道的空前关注。各大互联网和 AI 企业争先推出大模型,加快入场步伐。截至 2023年 11 月,我国已有近 200 家企业发布了大模型产品 16,其中超 30 家大模型产品通过备案 17,部分模型面向社会开放服务。政务领域是大模型厂商垂直布局的热点赛道,据统计,国内至少有 56 家大模型厂商在政务领域开展了布局,其中百度、智谱华章、科大讯飞、商汤科技、中国科学院自动化研究所、阿里云、360 和昆仑万维等 15 家厂商的大模型产品已通过备案上线。据公开新闻整理,大模型在政务领域的应用场景覆盖了政府办公、公文写作、政务服务、智慧司法、智慧党建、城市管理、公共安全等 7 类场景。

从场景热度看,政务服务类场景受到了 29 家厂商的关注,是大模型在政务领域布局厂商最多、竞争最激烈的场景。政务服务中的问询系统建设是与大模型产品对话交互性能最为契合的场景,华为、阿里云、科大讯飞、中国电信、中国移动、拓尔思、拓世科技等厂商均发布了大模型赋能政务咨询热线、政务聊天机器人的解决方案。城市管理类场景受到了 20 家厂商关注,也是布局较多的场景。

从场景成熟度看,城市管理和政务服务是大模型技术落地较多的两类场景。城市管理场景中,商汤科技与深圳市罗湖区携手打造大模型“AI 智能视觉分析平台”,助力城市运营管理效率提升;华为与西安市政府合作为所有摄像头加上“盘古”CV 大模型“智慧大脑”,实现异常事项分钟级自动化处理;佳都科技与重庆市共同开发城市交通行业大模型,推动城市交通管理智慧化。

政务服务场景中,百度与无锡市开展合作,打造 12345 智能问答助手、政务数字人,支撑政务服务“一网通办”;深圳市龙岗区将云天励飞“天书”大模型应用于政务服务咨询系统建设;厦门市人社局发布 12333 智能政务大模型,通过 AI 智能坐席替代人工坐席完成咨询服务工作。此外,智慧司法、公共安全等领域的大模型应用也有初步探索。

从部署方式看,厂商普遍基于通用大模型,辅以政务领域数据进行微调,采取定制化模式进行开发。

图 8 政务领域相关场景厂商数量分布

表 5 国内大模型厂商在政务领域的布局情况

(二)政策规范有待细化完善

2023 年 7 月,国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》),明确对生成式人工智能服务实行包容审慎和分类分级监管,规定了生成式人工智能服务规范,鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。具体到政务领域,目前尚无专门文件规范政府部门使用人工智能技术的行为,各地区各部门基于实践从推进发展、规范应用两方面提出若干要求,总的看内容较为分散。

在推进应用方面,多地发文明确政务领域大模型应用方向,强化引导和支持。

北京、上海、杭州、深圳等地发布的人工智能政策或行动计划中,均明确提及推进政务领域大模型应用,要求将政务列为大模型的垂直领域示范应用,率先突破,打造标杆性大模型产品和服务。在场景需求上,普遍将政务热线、智能客服等政务服务问询相关场景,以及城市治理、医疗、教育等民生场景作为大模型技术应用的重点方向。

在应用推进上,采取软硬结合多种方式进行支持。杭州、安徽要求加快打造政务领域垂直行业大模型;江西提出构建全国首个全省统一的 AI 全景智能公共服务 GPT 平台;北京通过招募政府通用人工智能创新伙伴、发布典型应用案例和场景需求、梳理产业创新图谱、开展应用案例征集大赛等手段,支持大模型厂商布局政务领域场景应用;上海、北京、江西、安徽等通过发放算力券支持政务领域大模型训练和应用。

表 6 我国各地区发布的政务领域大模型应用政策

在规范发展方面,现有政策主要从个人信息保护、政务数据安全等对政府使用人工智能技术提出部分要求。

《数据安全法》设专章对政务数据安全作出规范,提出国家机关为履行法定职责的需要收集、使用数据,应当在其履行法定职责的范围内依照法律、行政法规规定的条件和程序进行;委托他人建设、维护电子政务系统,存储、加工政务数据,应当经过严格的批准程序,受托方不得擅自留存、使用、泄露或者向他人提供政务数据。《个人信息保护法》要求,国家机关处理个人信息,应当在行政法规规定的权限之内,不得超出履行法定职责所必需的范围和限度。在涉及政府应用人工智能技术的伦理规范、算法透明、算法责任、算法歧视等方面,尚无细化要求。

《暂行办法》虽提出了生成式人工智能服务的一般性要求,但其适用对象为利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容的服务;未向境内公众提供生成式人工智能服务的,不适用本办法的规定。政府行为既包括对外提供服务场景,也包括内部决策、监管行为,无法完全适用《暂行办法》要求。未来随着实践深入,需加快探索人工智能等新技术新应用在政务领域应用的规范要求,细化形成行业性规范。

(三)国内典型应用实践

1.中国电信政务大模型助力“粤省心”政务服务平台中国电信政务大模型是面向政务行业的预训练大模型,采用“预训练-微调”策略,在基座模型基础上,利用广东“粤省心”政务服务的知识库以及省市政策文档作为大规模语料库,对模型进行微调,使其更好适应政务场景,并具备当地的政务知识。同时,结合客服的业务流程进行工程化适配开发,使大模型具备更加贴合客服场景的问答交互能力。

中国电信政务大模型提供面向市民端、坐席端和政府决策端的三大智能化场景。面向市民端,基于大模型的在线智能客服提供更好问答体验,减少市民排队等待时间,同时提供政务服务导办功能,通过“边问边办”的方式指引市民完成办事流程;面向坐席端,为坐席全流程智能化赋能,提供知识推荐、智能填单、智能派单、智能质检、智能回访等能力,提高坐席人效;面向政府决策端,通过工单信息挖掘,提供辅助决策和分析研判能力,快速发现苗头热点事件,帮助政府更好地做出分析和决策。

目前,中国电信政务大模型已被应用在“粤省心”政务服务平台,取得显著成效。通过大模型预训练和微调,“粤省心”智能客服在政务领域的回复准确率达到 90%以上,有效提升了用户体验和政府服务效率。在热线端,政务大模型的运用减少了热线服务中人工参与程度,有效缓解了“粤省心”热线量逐年递增带来的人员扩充压力。

2.九天·海算政务大模型赋能黑龙江数字政府建设

九天·海算政务大模型是中国移动基于近年来积累的丰富数字政府建设经验所打造的面向政务领域的行业大模型。依托九天·海算政务大模型,政务服务系统将具备强大的政务事项理解能力、多维度的信息关联能力、面向复杂事项和复杂流程的多元交互能力。

目前,九天·海算政务大模型已在黑龙江省数字政府建设的多个场景落地应用。

一是政务智能助手。

为有效提升政府一体化政务服务能力、打造最有温度的智能贴身政务助理,基于九天·海算政务大模型,统一建设省级、地市政务服务网智能客服、政务服务移动端智能客服,实现精准的智能问答、全国首例的智能导办、千人千面的智能推荐、方便快捷的语音交互等 26 项功能,为省内 3100 万百姓提供了方便快捷的智能化客服体验。截至目前,面向全省个人/法人已完成 10.71 万次线上问答服务,覆盖了政务服务、医疗保健、教育、交通、金融等多个行业或领域,问答好评率达 98.7%。

二是政务大屏助手。

为更好提升大屏展示的交互性、易用性和智能分析能力,黑龙江省数字政府项目引入了一个基于九天·海算政务大模型的数字人智能播报系统。该数字人可以通过与用户语音对话的形式,播报和解读大屏上的相关内容。通过引入数字人,用户无需再手动切换页面查找数据,只需直接提问,数字人即可在 1 秒内快速查找并汇报结果,极大地提高了工作效率。目前,该数字人可支持 6000+政务问题解答,准确率高达 85%以上。

三是“龙政智搜”引擎。

以数字政府指标库、数据资源库、政策法规库等为渠道,汇聚全省各地各部门政务数据,对汇聚的数据构建标签体系,借助大语言模型技术,实现自然语言查询,方便用户随时随地查询想要的数据。目前,“龙政智搜”引擎实现了政务服务、政务公开、经济运行等 8 大模块数据的智能搜索,支持模糊搜索、趋势搜索、时间空间维度搜索等多种搜索方式,支持图表展示、图表个性化定制、数据下钻等多种展示方式,提供智搜热点、联想搜索、政务热门词词云等便捷功能,提升用户使用的便利度。

3.华为盘古政务大模型打造政务智慧助手“小福”华为携手深圳市福田区政务服务数据管理局,基于华为盘古政务大模型打造福田政务智慧助手“小福”,改变传统“一网通办”模式,通过 AI 精准抓取交流对话字段,准确理解居民咨询意图,把老百姓的口语转化为政府办事的语言,提高政务办理效率,提升居民服务体验。盘古政务大模型对超过 20 万条政务数据进行精调,包括 12345热线、政策文件、政务百科等,掌握了丰富的法律法规、办事流程等行业知识,赋能政务业务从局部智能到泛在智能,提供政务智能办事助手、12345 热线坐席助手和企业营商助力等场景模型能力,实现问政、减负、谋策的智能化建设。

一是打造智能办事助手。

采用上下文关联推荐办事入口,对话小助手基于提示搜索已有知识经验沉淀,生成问题答复,提升事项识别准确率。在申报方面,基于要素提取,提供匹配情形的精准参考案例,对话式辅助办事,智能识别审批要点,实现最多点一次。

二是打造智能 12345 热线坐席助手。

依托盘古政务 NLP 大模型的基础能力,提供知识/话术推荐、问答生成、辅助填单、智能分类分拨,满足 12345 从咨询应答到质检归档的全流程智能集成受理,缩短话务坐席填单时间,赋能事件精准分拨和智能派单。

三是为企业营商助力。

通过政策学习智能推演,辅助政府惠企政策制定;通过全流程推演分析,辅助政府为企业量身定制优惠政策,实现事前政策推演预判、事中提高政策兑现率、事后兑付成效分析,使涉企政策更普惠、服务更精准。

4.科大讯飞助力上海塘桥构建大模型+基层治理新范式.

2023 年 8 月,科大讯飞星火数字社工系统正式发布,构建了“1+N模式”——1个星火大模型平台和N个业务应用,面向基层城市运行、基层为民服务、基层社区工作三大领域,实现事件智能分派、AI 辅助处置、居民办事助手、社工任务管家等业务功能,解决当前基层管理人员调度分析难、基层工作人员处置效率低、居民办事满意度低等现实问题,破解当前城市治理事件“最后一公里落地问题”。

目前,星火数字社工系统已率先在塘桥街道施用,为社区干部赋能。

一是助力基层城运事件流转提质增效。

星火数字社工提供事件智能分派服务,解决基层事件分派人员难以掌握海量权责清单、部门间推诿扯皮等问题,分派效率提升 30%以上;提供事件辅助处置服务,解决基层事件处置人员难以掌握海量法规条例,事件处置靠经验,事件处置效率低等现实问题;提供事件分析报告能力,解决当前事件统计类型固化、无法深入挖掘、缺乏全量事件关联推理能力等问题,大幅提升隐患事件发现率,实现事件分析报告编制急速生成。

二是助力基层为民服务精准温暖。

星火数字社工围绕基层为民服务,提供面向居民的 7×24 小时不打烊咨询办事助手,解决咨询全部靠人工、非工作时间无法提供服务等问题;提供面向工作人员窗口坐席辅助助手,解决窗口办事人员难以快速掌握海量办事服务条例、居民办事跑多次等问题,真实有效提升居民办事满意度。

三是助力基层社区工作便捷减负。

星火数字社工围绕基层社工日常工作,提供智能任务管家服务,解决当前基层社工任务杂乱难执行、人员管理难考核的实际问题,有效提升任务完成效率和绩效考核效率;提供智能通知助手,结合社区实际通知需求,自动电话和居民沟通,完成通知任务,并全程记录,解决当前通知事项重复率高、工作量大等现实问题,为一线工作人员真实减负。

五、趋势展望

目前,人工智能通用大模型已成为继移动互联网技术之后最大的一波技术浪潮,人工智能成为新一轮科技革命和产业革命的重要驱动力量,全球范围内科技巨头争相布局,掀起创业热潮的链式反应。其带来的价值会随着未来应用场景的不断拓展而增加,并可能创造新的应用接口、构建出新的应用生态、带来效率提升及潜在商业模式变革。

但同时需要认识到,生成式 AI 技术目前仍处于早期阶段,技术本身并不成熟,在内容可信度、可解释性等方面仍存在很多问题。政府推动生成式 AI 应用仍需要不断探索其价值点及使用方法,现阶段较为重要的是从战略、业务、组织、风险多个层面对政府机构应用生成式 AI 形成充分的认知:首先,生成式人工智能技术将给政府治理带来什么影响和价值;其次,政府特殊的信息化发展路径适合采用何种落地策略;再次,政府的组织人才体系如何适应技术变革需要;最后,技术存在哪些风险与局限性,需要重点予以规范。对应地,提四方面技术应用建议:

(一)平衡应用风险与收益

生成式 AI 大模型在政务领域应用前景广阔,尤其是在政务服务、文书写作等人与人互动及内容生产环节潜力巨大,能大幅提升互动效率,减轻不必要的行政负担,助力构建协同高效、泛在可及的数字政府。但由于技术本身仍处于快速变化之中,应用的潜在风险并非完全明朗,治理依然存在滞后性。面对新技术热潮,我们既要探索其价值避免落后于人,又要保持谨慎以规避风险。

一是要建立敏捷治理方式以适应技术快速变化,如采用监管沙箱推动政务大模型测试和应用,推动科技企业、公务人员、公民等共同探讨应用和治理策略,出台政务领域的针对性使用规范或指南指导各地探索等。

二是应当建立适当的风险分类分级管理框架,不同政务场景技术应用风险差异较大,国情的不同也导致国外的分类分级不能完全适用于我国政府情况,应结合我国数字政府建设的相关要求,明确列出应用领域和使用场景清单,并针对每个潜在应用场景进行“风险-获益”评估,实现分类分级管理。

三是因地制宜梯次推进场景应用探索,可优先考虑应用于风险较小的支持辅助类工作,如创建电子邮件、知识搜索等,再逐步向文本生成、数据分析、政策问答等中高级应用场景过渡,确保应用安全合规。

(二)强化技术与场景融合

国外政府在使用 ChatGPT 时主要采取使用市场产品和定制化部署的方式,少数政府机构正开发政务专属大模型。市场中类似于ChatGPT 的通用大模型具知识宽度有余但深度不足,政务专业知识的缺乏会影响输出结果的可信度,且需要投入大量人力去审查,与效率提升的应用初衷相悖。而定制化应用则需要政府具备较强的创新能力和基础,自建专属大模型成本较高。

因此,推进数字政府中大模型技术应用,需要兼顾技术效率和服务效能提升,在安全应用前提下,实现收益最大化。从应用层面看,政府需要充分理解大模型的技术特征,结合部门数字基础、治理需求等合理设计落地场景的优先级,做好效能监测评价。

同时,综合考量战略重要性、技术门槛、资源投入、数据储备、系统兼容性等因素选择合适的部署方式,如在何种层级、哪些领域选择自建大模型能力或是采购外部供应商的解决方案,实现技术赋能最大化。从产业层面看,需要积极发展垂直领域大模型,并利用外围插件,实施大模型和政务知识图谱、政务知识库相结合的策略,提升大模型的落地效果。

(三)推动内外部生态建立

推动大模型规模化应用,需要建立配套的政策、人才和技术保障,借助内外部力量,形成技术应用和升级的良性生态。

一是政府要加强引导,通过发布政策需求、梳理创新图谱、征集典型案例等方式明确应用探索方向,引导市场提供符合特定场景、性能、安全要求的产品或服务。

二是要提供与新技术应用相适应的组织人才支持。通过引入技术人才、借调科技企业人工智能专家等,帮助政府制定合适的大模型部署和推动策略。同时,强化现有员工数字素养培训,帮助其获得人工智能的知识和技能,了解技术限制,优化交互窗口提示输入,负责任地使用和实施人工智能技术。

三是要加强与企业和社会的良性互动、合作共治。如借助第三方机构力量,建立针对政务大模型的系统评估评测、监测处置能力;借助行业力量,开展政务行业大模型标准编制,全面评估政务大模型综合水平,实现健康有序发展;加强技术应用过程的公众参与,共同确定大模型在政务服务、城市治理等领域的优先场景和风险边界。

(四)加大高质量数据供给

数据是大模型的基础燃料,数据量大、数据质量高、数据多样性强的行业能够为大模型提供充足的训练和微调数据。无论采用定制化部署模式还是开发政务专属模型,都需要庞大、高质量的公共数据支撑。当前,我国已逐步健全一体化政务大数据体系的共享通道,加快推动政务数据共享和公共数据开放,但有通道无协同、数据质量不高、源头治理不足的问题仍然存在。推动政务领域大模型应用,一方面要加快公共数据的整合利用,以公共数据或公开政务文本为基础打造政务大模型训练的统一底座,在确保安全的前提下提升企业训练模型的可用性。另一方面要统筹开展全量政务数据治理,细化各部门数据管理职责,加强数据源头治理的法规标准体系建设,实施数据质量工程,定期进行数据质量评估,提升高质量数据供给。

总结:

根据2024年政府工作报告,我们可以总结出以下几点关于数字中国建设的内容:

1. 加强数字基础设施建设:政府将继续加大投入,推动5G、物联网、人工智能等新一代信息技术的发展,为数字中国建设提供坚实的基础设施支持。

2. 优化数字政务体系:政府将以人民为中心,进一步推进政务服务数字化、智能化,提高政务服务效率,让人民群众在数字化时代享受到更加便捷、高效的政务服务。

3. 促进数字经济发展:政府将支持企业加大数字化转型力度,推动传统产业与数字技术的深度融合,培育新兴产业,提高产业链水平,助力实现高质量发展。

4. 保障网络安全:政府将加强网络安全防护体系建设,确保国家信息安全,维护人民群众的合法权益,为数字中国建设提供安全保障。

5. 提升数字文化传播力:政府将支持数字文化产业发展,推动优秀传统文化与现代科技相结合,提升中华文化的传播力和影响力。

6. 保障公民数字权益:政府将加强对公民个人信息的保护,维护公民在数字空间的合法权益,为公民提供安全、便捷的数字生活环境。

7. 推动数字生态文明建设:政府将充分利用数字技术,推动生态文明建设,实现绿色发展,为人民群众创造美好生活环境。

总之,2024年政府工作报告强调了数字中国建设在经济、政治、文化、社会、生态文明等方面的重要作用,明确了政府在数字中国建设中的任务和目标,为我国数字中国建设提供了明确的指导方向。

大模型岗位需求

大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。
在这里插入图片描述

掌握大模型技术你还能拥有更多可能性

• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;

• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;

• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把全套AI技术和大模型入门资料、操作变现玩法都打包整理好,希望能够真正帮助到大家。

-END-


👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

  • 9
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值