搞政府大数据平台的,标准规范是一个绕不过去的内容,而且政府项目对标准规范貌似都特别看重,这是与做企业项目很大的不同。政府大数据平台的标准规范可以从以下几个方面制订:
- 数据接入,包括结构化、非结构化数据,以及实时、批量数据的接入汇聚;
- 数据治理,包括数据质量、数据清洗融合、数据模型设计等;
- 数据服务,主要是对应用、委办局的数据支撑,包括数据文件、API接口等;
- 数据安全,此处主要是通过数据脱敏、数据加密等手段对数据加工过程的各环节的安全保护。
那么,具体到大数据平台项目,标准规范应该写点什么呢?之前阅读了不少关于大数据平台、信息系统的国家标准、地方标准等,同时结合与客户的讨论,我认为在数据接入方面,标准规范可以从以下几个方面编写:
- 标准规范的阅读对象应该包括大数据平台的技术人员、提供数据的各委办局等;
- 大数据平台支持的数据接入类型,目前我所在的项目包括共享交换接入、业务系统库表接入、文件格式接入、API接口接入等这几类。在标准规范中要从总体上描述清楚这几种接入类型的区别及适用场景;
- 工作流程相关的模板,比如,对于库表接入时,需要提供给委办局的相关人员,模板中包括了需要对方提供的文件列表、填写的对接参数等,这些模板可以指导相关的技术人员高效准确地收集到数据对接所需要的信息;
- 平台的技术接口,不同数据接入类型在实现对接时需要遵循的技术接口,在标准规范中可以详细列出,比如,库表接入需要开放的权限、文件格式所支持的格式及要求具备的内容、API接口的列表等。
以上是我能想到的对于数据采集标规范可以写的内容。
欢迎加入QQ群进行更多交流:958911138