数据标准化是实现数据共享的基础。数据标准化主要为复杂的信息表达、分类和定位建立 相应的原则和规范,使其简单化、结构化和标准化,从而实现信息的可理解、可比较和可共享, 为信息在异构系统之间实现语义互操作提供基础支撑。数据标准化的主要内容包括元数据标准 化、数据元标准化、数据模式标准化、数据分类与编码标准化和数据标准化管理。
1.元数据标准化
元数据最简单的定义是:元数据是关于数据的数据 (Data About Data)。在信息界,元数据 被定义为提供关于信息资源或数据的一种结构化数据,是对信息资源的结构化描述。其实质是 用于描述信息资源或数据的内容、覆盖范围、质量、管理方式、数据的所有者、数据的提供方 式等有关的信息。
1)信息对象
元数据描述的对象可以是单一的全文、目录、图像、数值型数据以及多媒体(声音、动态 图像)等,也可以是多个单一资源组成的资源集合,或是这些资源的生产、加工、使用、管理、 技术处理、保存等过程及其过程中产生的参数的描述。
2)元数据体系
根据信息对象从产生到服务的生命周期、元数据描述和管理内容的不同以及元数据作用的 不同,元数据可以分为多种类型。从最基本的资源内容描述元数据开始,指导描述元数据的元 元数据,形成了一个层次分明、结构开放的元数据体系,如图5-2所示。

图5-2 元数据体系与元数据类型
2.数据元标准化
随着国际电子商务和贸易的快速发展,需要 一 个互连、互通、互操作的开放系统互连环 境(Open Systems Interconnection Environment,OSIE)。OSIE四个基本要素(硬件、软件、 通信和数据)中的三个要素(硬件、软件和通信),已经或正在制定相应的标准。为了使数 据在各种不同的应用环境中易于交换和共享,国际标准化组织 (International Organization for Standardization,ISO) 提出了数据元标准的概念,要求按共同约定的规则进行统 一 组织、分类 和标识数据,规范统一数据的含义、表示方法和取值范围等,保