13.5 数据架构规划与设计
13.5.1 数据库设计与类的设计融合
对类和类之间关系的正确识别是数据模型的关键所在。
13.5.2 数据库设计与XML设计融合
XML文档分为两类:
以数据为中心的文档,结构上是规则的,在内容上是同构的,具有较少的混合内容和嵌套层次,人们只关心文档中的数据而并不关心数据 元素的存放顺序,简称为数据文档,它常用来存储和传输 Web 数据。
以文 档为中心的文档,结构不规则,内容比较零散,具有较多的混合内容,并且元素之间的顺序是有关的,常用来在网页上发布描述性信息、产品性能介绍和 E-mail信 息等。
XML文档的存储方式有两种:基于文件的存储方式和数据库存储方式。
(1)基于文件的存储方式。将X ML文档按其原始文本形式存储,主要存储技术包括操作系统文件库、通用文档管理系统和传统数据库的列(作为二进制大对象BLOB或字符大对象CLOB)。需维护某种类型的附加索引,以建立文件之间的层次结构。
特点:无法获取XML文档中的结构化数据;通过附加索引可以定位具有某些关键字的XML文档,一旦关键字不确定,将很难定位;查询时,只能以原始文档的形式返回,即不能获取文档内部信息;文件管理存在容量大、管理难的缺点。
(2)数据库存储方式。数据库在数据管理方面具有管理方便、存储占用空间小、检索速度快、修改效率高和安全性好等优点。 采用数据库对XML文档进行存 和操作,利用相对成熟的数据库技术处理XML文档内部的数据。
特点:能够管理结构化和半结构化数据;具有管理和控制整个文档集合本身的能力;可以对文档内部的数据进行操作;具有数据库技术的特性,如多用户、并发控制和一致性约束等;管理方便,易于操作。
在数据量和操作用户较少并且性能要求不高的情况下,XML文档能够作为数据库在应用程 序中使用。
XML数据库是一组XML 文档的集合,是持久的和可操作的;有专门的DBMS 管理 (不是XML文件系统);文档都是有效的(即符合某一模式);文档的集合可能基于多个模式文 件(即文件扩展名为.xsd), 多个模式文件之间可能有语法和语义上的相互联系。