1.1 项目建设目标
推进市一级政府搭建数字政府建设的规划要求,结合市一级政府“互联网+政务服务”建设现状,牢牢抓住市一级政府政务大数据应用的痛点,以云计算、大数据、物联网、区块链、人工智能等技术为支撑,以“统筹规划、集约建设、共享共治”为原则加强市一级政府政务大数据顶层设计。
通过市一级政府政务大数据能力平台项目建设,以数字化、数据化、智能化、智慧化为实施路径,加快实现“平台通、数据通、信用通、业务通”,推动政府全方位、系统性变革和数字化转型,建立服务高效、治理精准、决策科学的新型政府运行模式,提升政府运行效能,优化营商环境,为推动“新基建”产业发展奠定基础。
1.2 市一级政务大数据应用的痛点分析
尽管目前市一级政府普遍在数据治理方面工作取得了一定成效,但部分仍存在数据管理机制尚未健全、数据标准执行效果不佳、数据共享能力有待加强、数据应用能力仍需提升等问题。
1、数据共享难质量不高:各个部门审批系统数据共享难,数据推送不及时,经常掉件、错件,已有的部分数据存在数据质量问题,导致线下、网上办件效率不高。
2、数据小农意识:越来越多部门意识到“数据是一种财富”的时候,反而阻碍了内部数据资源的整合。存在着严重的“数据小农意识”,各自为政,各行其是,导致一个个“信息孤岛”的产生。
3、数据烟囱林立:政府各部门独立开展本单位信息化建设,无论是逻辑上还是物理上都是分散的,很多相同的信息在不同的部门被重复采集和存储,但格式各异,内容不一,导致“数据烟囱”林立。同时,面向部分国垂和省垂信息化系统,现阶段这类系统的数据还难以采集和获取。
4、数据标准缺失:如果上级标准不明确不细化,下级如何开展数据标准梳理工作?下级部门形成了标准,如何得到上级认可?如何与其它地方标准对接?
5、数据管理无序:数据管理工作无序化现象严重,各政府部门重本单位需要轻跨部门统筹要求,存在利益固化的体制壁垒,困扰政府数据治理的可持续发展。
6、数据质量不高:数据质量不高,数据标准不统一,难以用统一的数据模型或者数据算法完成。
7、数据多效果少:信息孤岛、数字鸿沟依然严峻,数据价值的普惠化不足;数据质量不高,数据资源流通不畅,管理能力弱,数据价值难以被有效挖掘利用。
8、科技新落地少:应用领域不广泛、程度不深,尚未体现出数据融合的价值。善政、兴业、惠民的数据应用场景少,体验还处于节点化阶段,只存在于某项服务、某个系统、某个平台,尚未走向全网化。
9、单点强全局弱:数据平台、应用系统建设侧重功能叠加,忽略了能力叠加;硬件过度建设,全局数据智能不足;单极化、断头式服务导致政府服务的广度和深度仍然不足。
1.3 项目建设内容及规模
1.3.1 政务平台总体技术架构
1.3.2 政务平台总体设计
1.3.3 “数据层”的服务能力提升
一、完善数据治理标准
在国家和省政务数据治理相关标准框架下,开展数据采集汇聚、数据共享开放、数据安全以及数据管理等方面的标准化建设。
(1)完善统一事项目录和数据资源目录,形成部门数据责任清单、系统数据清单、数据需求清单等“三张清单”,建立统一的事项目录和数据资源目录,使得两个目录的规范率达到90%以上。
(2)完善数据采集汇聚机制,实现对市直部门及重点行业的基本数据的完整收集。
(3)完善数据更新机制,实现数据鲜活率达到90%,为政务业务的开展提供鲜活的数据支撑。
(4)完善省市区数据共享模式和共享渠道。构建省、市一体化共享体系,建立完善数据共享机制,最终实现信息共享率达到90%。
二、加快数据仓库建设
(1)完善基础库建设,按统一的政务大数据体系建设要求,建设完善自然人、法人单位、社会信用、电子证照等基础信息库。
(2)加快主题库建设,在汇聚整合部门基础库的基础上,加快建设完善市级主题库,并由业务部门牵头建设政务服务、宏观经济、营商环境、精准扶贫等专题库。
(3)完成监管数据中心建设,按照国家“互联网+监管”平台的建设要求,梳理市一级政府监管目录,完成互联网+监管核心业务基础数据库和主题数据库建库。
(4)实现时空大数据中心建设,按照市一级政府“统一数据资源”的要求,对已有空间数据与非空间数据进行坐标转换、格式转换、数据建库;基于一个数字网格,创新管理与服务模式,实现社会治理、疫情防控、监管功能叠加的网格划分与建库。
三、运用区块链技术进行数据确权、追溯
数据确权:当数据从各专业系统集成至大数据中心应用层形成时,要进行一定的数据封锁、确权,明确数据管理权,可保证对外提供数据的安全性,不会造成其他人对数据的篡改、转发等。通过区块链零知识证明技术实现对数据保密和对外服务双重需求。一方面保证了数据加密安全,二是体现了数据在保护隐私的环境下进行业务上的多方验证。通过区块链智能合约实现价值数据的授权使用,赋予数据所有人以权力,以智能合约对价值数据的接入、请求、授权、共享行为进行管控,数据供需两端权责分明、无可抵赖。
数据追溯:系统会按照时间顺序链接每次数据使用信息,不会像普通的中心化数据库容易被篡改,从而可以实现数据流上的可追溯,用户在“授权记录”中可以随时随地查询授权时间、数据类型信息,并可在使用后随时解绑。需要说明的是,存储在区块链上的数据信息是公开的,但数据流向是被严格保密的,这也在最大程度上保护了用户的隐私。
四、强化数据管理机制
(1)制定政府数据管理责任,强化绩效评估,推动数据治理工作持续有效开展。
(2)建立数据质量问题处理机制,规范数据质量问题处理流程,拓宽数据纠错反馈渠道,提高数据问题解决的及时性,切实提高数据质量,确保相关数据的一致性、规范性和完整性。
1.3.4 “支撑层”的分布式架构改造
一、分布式云架构改造
随着分布式技术和云计算技术的大力发展和交叉融合,基于云计算平台的分布式架构可以有效的解决传统集中式架构的成本高,扩展性差等问题。且云计算特有的热迁移,亲和性和背离性等特性可以有效的提高了业务的稳定性和灵活性。面向未来市一级政府政务大数据的应用场景,采用分布式云架构对政务云平台进行改造升级。
市区两层平台对接
二、区块链平台建设
区块链技术是利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传输和访问的安全、利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算范式。简单来说,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术在互联网时代的创新应用模式。
1.3.5 “应用层”的深度挖掘和关联应用
一、自然人画像
以公安人口数据为基础,逐步融合卫计委、民政厅、人社厅、教育厅等部门的相关信息资源,重点建设和整合公安户籍信息、人口普查信息、公务员信息、社会保障信息和人事关系信息等信息资源,扩展健康、收入、婚姻、社保、救助、贫困、残疾、流动、死亡等信息,逐渐丰富人口基础信息资源条目,构建以公民身份号码为唯一标识的、全市统一的、可共享的人口综合信息库。为全市相关部门的业务应用、跨部门业务应用和宏观决策等提供基础数据支持与服务。同时,确定企业和社会公众各类人员的访问权限,实现人口信息全方位服务。
二、企业画像
综合各委办局法人信息,构建以统一社会信用代码为唯一标识的、全市统一的、可共享的法人综合信息库。包括各类法人单位的组织结构、股权结构、经营范围、资产规模、税源税收、销售收入、就业人数、人才构成、产品服务等信息,为全市相关部门的业务应用、跨部门业务应用和宏观决策等提供基础数据支持与服务。
三、人企立方(关联图谱)
运用图数据库,将自然人画像和企业画像进行关联,建立自然人与法人之间的关联图谱,为全市相关部门的业务应用、跨部门业务应用和宏观决策等提供基础数据支持与服务。
四、时空大数据服务
充分运用自然人画像、企业画像、人企立方、轨迹信息和地址信息建立社会治理、疫情防控、监管功能叠加的网格化管理体系。
五、运营指挥中心
充分利用物联网、云计算、大数据等信息技术,基于市电子政务建设的基础支撑环境,以政务管理主题库为基础,扩展建设新型城市智慧中心业务所需地理信息库、业务库、主题库和指标库,建设融合业务展示系统,提供综合的运行监测、信息查询展示、信息简报呈现、数据分析、联动指挥、决策支持等资源服务应用。实现市政府领导及相关委办的融合数据资源视角,实现数据信息资源融合服务与创新服务,通过系统达到及时了解本市发展的综合情况,及时掌握发展动态,为政策拟定提供依据。
1.3.6 “展示层”的多媒体融合
一、GIS平台建设
对外提供统一的资源展示窗口,满足时空信息的使用需求;完善平台的空间分析服务方法,实现时空大数据下的复杂GIS分析;建设时空大数据的挖掘与可视化服务能力,梳理平台的服务层次和体系,提升平台的时空信息服务支撑能力。
二、可视化平台建设
该平台可将清洗整理后的各类成果数据和指标通过图表、动画等形式形象、直观的展现。既可通过互联网、微信、微博等渠道公开发布,也可通过政务外网数据直报系统向政府定期推送,即可展示于会议室大屏,也可展示于手机、笔记本、平板电脑,以便于政府科学化精细化决策。
可视化平台:
三、AI人工智能平台建设
人工智能平台是数据应用的进一步延伸,推动数据应用进一步智能化,将在数据治理平台进行的一系列的数据服务构建操作进行智能化实现,让数据的接入、存储、分析展现、训练、到构建管道更加自动化。主要能力包括文本文档处理、机器视觉及语音智能等,在提供通用能力的基础上,需要结合数据和业务需求进行AI能力的定制化适配。
1.3.7 安全体系建设
按照国家关于国、省、市、县四级安管中心建设规划的总要求,以国家《网络安全法》为核心,建设市网络安全管理中心,筑牢网络安全防线,确保基础网络和重要信息系统安全可靠运行。逐步推进安全等保测评、软件测评、密码安全测评等,确保严格按照国家安管中心的数据标准进行数据同步监管和网络突发事件应急处理。
1.4 平台架构
市一级政府政务大数据能力平台建设的目的是打破“信息孤岛”,从而满足未来市一级政府信息化建设发展过程中全市范围大数据应用服务支持,实现数据决策和支撑政务服务做好基础工作。项目的技术架构设计采用开放式的、基于体系标准的、平台管理的多层体系架构,见下图所示:
图:平台架构
1、多源数据:汇聚政务数据、物联网数据、互联网数据、运营商数据、社会数据等多源数据,为城市经济社会发展提供全面数据决策。
2、数据采集:为了满足各部门之间数据采集交换的需要,平台基于国家关于数据采集交换的标准体系,建设了统一的数据采集交换子系统。数据采集交换子系统采用组件化思想,提供了一系列的开放交换组件,系统功能包括数据资源管理、数据采集、数据交换、数据上报和数据同步等功能。
3、数据仓库:本平台的建设核心是建成全市统一的大数据中心,建设大数据中心包括部门数据和基础库两大类。其中部门数据用于接收各部门用于共享的部门共享数据库;基础库是基于国家基础数据库建设标准,结合各地省市的业务特点,面向全市业务系统建设要求而形成的基础共享数据库,包括人口基础数据库、法人基础数据库、地理信息库、统计信息库和城市活动信息库。
4、数据治理:提供数据汇聚、组织、存储、同步、纠错、评估、监控等功能的多个纬度的管理工具,主要实现政务数据目录、需求、共享、交换和质量方面的管理功能。实现数据质量管理、数据建模、数据展现、安全、脱敏、审计等功能。根据国家和省级相关标准构建市政务大数据能力平台信息资源目录体系、标准规范体系、数据安全保障体系,重新梳理和完善信息资源目录,提升准确性和价值性;建立大数据标准体系,提升数据质量,规范数据使用;构建数据安全保障体系,确保数据安全可靠。
5、应用支撑:提供统一的AI服务,数据开发服务、可视化服务和基础业务支撑服务,通对服务进行统一管理。构建市区块链平台,逐步实现区块链+电子证照、区块链+政务服务等服务,同时与省级区块链打通。
6、数据应用:深化数据汇聚,着力形成“汇集—分析—研判—推送—核查—反馈”的数据应用闭环,在充分应用中实现“数战数决”。
基于空间地理信息库,审核空间地理信息应用;持续深化健康码应用,打造民生服务“一码互联”;构建市城市运营指挥平台;深挖大数据价值,持续提升在市政务服务、民生服务、产品服务水平。
1.5 业务逻辑
图:业务逻辑
业务架构针对实际业务场景,将各子系统或平台根据业务职能作以划分,并明确了各子系统或平台功能边界。同时描述了相互之间的依赖关系与协同机制,对各子系统进一步功能设计起到规划指导作用。
本项目业务架构主要包括四部分:资源目录、数据采集交换、数据管理、数据共享服务。
1、资源目录:资源目录是政府政务数据资源管理服务平台要解决的核心问题之一。通过资源目录才能在遵循国家信息资源目录编制规范的基础上进行各部门的信息资产进行登录管理,各部门才能依托数据资源管理服务平台进行资源的统一发现、统一申请和统一调用资源服务。
2、数据采集交换:数据采集交换是政府政务数据资源管理服务平台的另一项重要核心业务功能,通过数据采集交换才能实现公共基础数据、行业应用数据、实时监控数据、互联网数据等各类信息的汇集和实时共享,进而才能对这些汇集上来的有共享需求的信息进行关联整合,才能实现“一数一源”,打破信息孤岛,实现跨部门、跨领域的信息共享,提升数据价值。 项目建成后,数据资源管理服务平台将是全市公共信息传输、交换、共享的枢纽,未来需快速处理大量、高并发需求的结构化、非结构化数据,例如全市视频数据、数十个部门文档数据、全市感知数据等。
3、数据管理:为了确保交换过来的数据质量,数据资源管理服务平台还必须对采集过程中的数据进行事中清洗比对、事后数据质量稽审,提供数据中心透明的数据管理、统一的数据处理和安全的数据共享服务建设,解决数据要进来和管起来的问题。数据管理作为未来基础数据库的运营管理核心,从入口处要确保数据质量,中间承载数据交换全过程管理、数据处理全流程监控以及对错误处理的结果进行反馈和整改的能力。
4、数据服务:数据服务是最终面向用户提供服务的窗口,是对大数据平台成果综合展现和利用的门户,因此要求能够提供丰富的资源展现以及便捷的用户使用。本项目中采用数据管理平台处理完成的基础库数据通过数据整合服务形成可对外访问的服务,再经由信息资源共享服务平台发布在平台门户供部门申请使用,同时提供对部门申请进行审批及服务支持,并对部门服务使用情况进行跟踪,不断完善数据与服务,以灵活化、多样化的方式更好为智慧城市建设提供数据服务支持。
1.6 数据架构
图:数据架构
单位数据在采集交换过程中首先将本部门的业务数据交换到前置共享库中,数据采集交换平台定期进行数据抽取,将前置区的前置共享库抽取到大数据处理中心的中心汇聚库;中心汇聚库通过数据清洗比对,将比对正确的数据统一纳入部门库中,对于错误的数据归入管理库中,并且将错误信息推送反馈回去;进入部门库的数据再次通过清洗比对规则进行数据比对后,将比对一致的数据进行变更检查,检查发现数据有变化则进行数据变更处理,最终形成基础库和主题库。
整个数据处理流程将涉及前置区和大数据中心区两块。
前置区:前置区是各委办局与大数据中心进行数据交换的中间区域。一方面用于委办局将需要共享的数据进行前置共享到大数据中心区域中;另一方面用于将接收委办局所需要的来源地大数据中心区的共享数据。前置区由委办局负责将需要前置共享的数据提交上去。
大数据中心区:大数据中心区是J市政务大数据能力平台建设的数据区域,用于数据的加工处理、清洗比对、汇聚统计和存储。
数据处理流程过程中,将涉及前置共享库、中心汇聚库、部门库、管理库、基础库和主题库。这些库在处理过程中分别扮演不同角色,详细描述如下:
前置共享库:前置共享库是前置区中,各委办局用于对外共享的数据库,此库可起到隔离委办局业务库的作用。
中心汇聚库:中心汇聚库通过数据采集交换平台周期性地从前置共享库中抽取数据,此库将作为大数据中心区其他库的数据源库,起到缓冲汇聚作用。中心汇聚库的数据由于完全“搬”的前置共享库数据,并没有经过清洗比对过程,数据质量没有保障,不作为共享使用。
部门库:部门库是通过对中心汇聚库的数据进行清洗比对后,对于正确的结果数据将统一清洗比对进入部门库。此库的数据是有质量保障的,将作为部门对外共享的数据来源。
管理库:对于清洗比对后的错误信息、比对不一致信息以及数据处理的日志信息等,将由管理库进行统一管理。管理库是大数据中心区数据管理的基础。
基础库:基础库用于省市的基础信息,包括人口基础库、法人基础库、信用库、行政权力事项库等。基础库将通过对中心汇聚库的数据清洗、数据比对和变更检查过程而形成。
主题库:主题库是面向业务主题域而形成的一种公共数据库。其中,主题库可通过对中心汇聚库的数据清洗、数据比对和变更检查形成;另外主题库也可对基础库进行统计、汇聚而形成。
关注我的技术公众号,每个工作日都有优质技术文章推送和电子版方案下载。
微信扫一扫下方二维码即可关注:
文件下载地址:https://download.csdn.net/download/llooyyuu/88692816