很多信息的描述、定义、获取、表示形式由于缺乏统一、严格的标准,致使大量的信息数据处于分散的、部门所有的和各自为政的状态,造成数据信息资源浪费,不利于实现全社会的数据共享。为了提高政务信息的共享和集成分析,保证为政府的管理决策和社会各阶层提供科学准确的信息,迫切需要开发出一种统一的、以标准数据元形式的对政务信息的表示方法,以支持政务信息的共享和交换。
数据元(Data Element)是表示概念的一类数据,其特性可由支持信息交换的一组数据元属性来表示。或者说数据元是一组可识别和可定义的数据基本单元。一般来说数据元由数据元的名称、属性、表示三部分组成。
数据元是用一组属性描述其定义、标示、表达和允许值的一个数据单元。 组成数据元规范的基本属性分为标示类属性、定义类属性、关系类属性、表示类属性、管理类属性。当然还可以根据需要增加扩展属性。数据元属性应依照一种标准方式来注册和控制,以便数据元字典中的数据元在信息交换中保持一致性,并且能够在不同的数据管理环境中进行数据元管理。数据元的基本属性主要有以下几类:
s 标示类,适用于数据元标示的属性。包括名称、标示符、版本、注册机构、同义名称、相关环境。
s 定义类,描述数据元语义方面的属性。包括定义。
s 关系类,描述数据元之间相互关联和(或)数据元与分类模式、数据元概念、对象、实体之间关联的属性包括分类模式、关键字、相关数据参照、关系类型。
s 表示类,描述数据元表示方面的属性包括表示类别、表示形式、数据元值的数据类型、数据元值的最大长度、数据元值的最小长度、表示格式、数据元允许值。
s 管理类,描述数据元管理与控制方面的属性包括主管机构、注册状态、提交机构、备注。
在这些基本属性中名称、定义、表示类别、表示形式、数据元值的数据类型、数据元值的最大长度、数据元值的最小长度、数据元允许值是在描述数据元时是必选的。
数据元表示是在数据处理和信息交换过程中数据元所采用的格式。如数据的长度、数据的类型等都要给予说明,数据元的格式受数据元的属性及应用环境限定。
数据元可分为通用数据元和应用数据元。通用数据元是独立于任何具体的应用而存在的数据元,其功能是为应用领域的数据元设计也就是为应用数据元的设计提供一部通用数据元字典。应用数据元是在特定领域内使用的数据元集,例如在电子政务领域的应用。从这个意义上来讲国家标准《数据元及交换格式、信息交换、日期和时间表示法》就应该是一部通用数据元字典。
所谓数据元的标准化就是对数据元的总则、定义、描述、分类、表示和注册等制定统一的标准,并加以贯彻、实施的过程。在大量繁杂的政务信息中,哪些概念可以作为我们定义数据元的基础,数据元概念的特性中哪一个可以继承下来作为派生的通用数据元的特性,通用数据元特性中的又有哪些可以被应用数据元所继承。以上这些问题都是数据元标准化过程所要解决的。
随着社会的发展,信息在社会各个行业中的作用不断提高,数据元标准也越来越引起各个行业的重视。人们认识到只要对信息按共同约定的规则进行统一组织、分类与表示,使用同一的概念,并用相同的表示,就能做到共识,不致产生歧义。这种简化的概念表述,提高了数据的准确性,有利于数据的共享、交换。
各政务系统所要处理的对象主要是数据,数据元标准所要起的作用就是用一个统一的标准来描述、定义、规范这些系统所要处理的数据,为系统间的数据共享、数据交换提供一个公用的信息接口。这个公用的信息接口的基础是政府部门的数据环境建设,而数据环境建设的基础就是用数据元标准来描述数据源,建立电子政务领域的应用数据元字典。这个公用的信息接口实际上就是我们对政务领域的信息以数据元标准进行描述,形成一个大家都广泛接受,并在政务系统的开发过程中遵守的规则。在此基础上,各种系统之间的数据共享、数据交换成为可能。
数据元的标准化过程起到了一个针对要处理的数据源进行规范化的作用。通过这个过程,规范了其中的概念、定义、以及知识的描述,形成了数据元词典,根据这个词典一方面数据库的内容的规范有了依据,另一方面数据库的结构也得到了规范。