声明:该文章源于oracle官网 ,经博文只是对其进行了梳理。
本文适用于不了解 Oracle 中 XML 实现的 DBA 或开发人员:其中简要概述了 SQL 和 XML 互操作性和如何着手处理存储在 Oracle 10g 第 2 版数据库中的 XML 文档,此外,还介绍了 DBA 和开发人员在数据库中使用 XML 之前应该熟悉的由 Oracle 数据库 10g 第 2 版提供的大量新特性。使用这些 SQL/XML 特性,可以轻松增强您在使用关系数据时获取的技能,以便帮助您使用 XML。
什么是 Oracle 的 XML 实现?
Oracle 已经通过数据库的 XML DB 组件实现了 XML,该组件是企业版和标准版的标准特性。通过数据库配置助手 (DBCA) 或者运行一个目录脚本 catqm.sql,可以轻松安装 Oracle XML DB。XML DB 产品提供本文讨论的所有特性。
要验证是否安装了 XML DB,只需运行下面的 SQL:
select comp_name from dba_registry where comp_name like '%XML%';
COMP_NAME
Oracle XML Database
也可以查看 XML DB 模式及其对象来确认是否安装了 Oracle XML DB。
SQL 和 XML 协作
SQL/XML 标准已处在开发之中,以便提供一个允许我们从关系查询生成 XML 的机制,并反之使我们能够从 XML 文档提交 SQL 数据。Oracle 数据库 10g 第 2 版中的 Oracle XML DB 实现 SQL 2003 和来自即将推出的 SQL/XML 标准版的特性。Oracle 中这些标准的实现使我们能够以在之前 SQL 标准中不可能的方式查看 XML 文档。
新数据类型。 Oracle9i 数据库第 1 版中引入了一个新数据类型 XMLType,它允许在 SQL 中访问数据库中的 XML 文档,同时允许 XML 开发人员在文档中使用 XML 标准。该数据类型通知数据库该内容是 XML 格式的,并允许我们在 XML 文档上执行查询。使用 XMLType(而非一个关系或 CLOB 实现)在应用程序和存储模型间提供一个分离层。该分离允许数据移到一个不同的存储模型,而不局限于 CLOB 或关系模型。XMLType 可用于创建表、列或视图。它还可用作参数和变量的数据类型。
内置的 XML 方法可以处理文档内容,允许我们创建、提取和索引 XML 数据。索引可以使用 b 树、文本索引和基于函数的索引执行。实际上,与 XPath 合并的 XMLType 数据可用于查看文档。该功能通过 PL/SQL 和 Java API 提供。XMLType 可用在 PL/SQL、使用 JDBC 的 Java 以及 Oracle Data Provider for .Net 中。这个功能强大且相对较新的数据类型将在本文中广泛使用。
存储结构。 Oracle 的 XML 实现为我们提供了以两种不同方式存储数据的灵活性:结构化存储和非结构化存储。XMLType 数据在存储为单个 LOB 列时是非结构化的,在实现为对象集时是结构化的。
它的一个特定示例是 XMLType 表,该表可以使用这两种存储模型之一实现。XMLType 表在使用如下所示的“XMLType store as CLOB”语法实现为 LOB 时是非结构化的:
create table table_name of XMLtype XMLType store as CLOB;
让我们重点看一下 XML 数据的结构化存储和非结构化存储并进行更详细的了解。
结构化存储。 将结构化 XML 存储实现为一组对象。这些对象可通过具有可以在表间实现的引用约束的表以关系格式实现。它们也可以使用一个 XMLSchema 实现,以便将一个 XMLType 文档分解为一组对象。
在使用关系表的情况中,可以因此对这些表进行预先设计,或者使用现有表。该文档实际上通过关系表存储为“虚拟”文档,并保留其逻辑结构。该方法可维护文档 对象模型 (DOM) 保真度,但是它不是文档的逐字节物理表示。这可以通过创建一个关于现有关系数据的 XMLType 视图来完成。
结构化存储比非结构化存储具有一些性能优势,选择它可通过表和索引设计提供更多的查询和更新优化。结构化存储上的 XML 操作有助于减少内存和存储,因为没有存储 XML 标记,而且存在更细粒度的数据检索和使用。基于 b 树和基于函数的索引使用得到了增强,而且使用 XPath 重写可在文档的部分上执行适当更新。所有这些都对性能有所帮助,本文稍后将详细讨论。
使用结构化存储也有一些缺点。插入和检索整个文档需要更多开销。此外,灵活性有限,因为只能存储匹配 XMLSchema 的文档 — 但是在某些情况中,这实际上是个优势。文档不存储为逐字节原始表示,而且不保留文档中的数据顺序。但是,这将不会出现数据丢失的情况。
我们通常会将高度结构化的数据看作是 XML,其中数据的每个元素都可以清晰定义。
非结构化存储。 XML 可以使用 CLOB 存储以非结构化方式存储在 Oracle 中,以便 SQL 查询不会知道该数据的结构。该数据可以使用 Oracle 的 XMLType 数据类型存储。
如果想让存储数据匹配文档的准确物理表示,可以选择非结构化数据。此外,如果该数据不经常更新,或者整个文档(而非部分文档)有大量的插入和读取,则将数 据整体放在一处可能更高效。在某些情况中,您需要保持文档的灵活性,而且在这些情况中,XMLType 表或列可能是有用的。
非结构化存储的缺点是,对部分文档的更新通常不如结构化数据那样高效。此外,使用函数从 CLOB 构造 DOM 的 XPath 操作将使用大量的系统资源。非结构化数据的其他问题是,SQL 约束无法实现,而且内存管理也不是如此有效。
我们通常不将非结构化数据作为 XML 数据考虑,并将其中大部分或所有数据只看作是单个 CLOB。
了解了这些存储模型后,现在让我们来看一些命名特性。
命名空间中有什么?
这是一个大主题,也是需要了解的较复杂的 XML DB 概念之一。在本文中,我们将介绍一些命名空间概念,以便您了解其要旨所在及其用法。
命名空间用于描述 XML 文档中的一组相关属性或元素。命名空间可用于确保文档构造有完全唯一的名称。XMLSchema 尤其要利用该特性,因为目标命名空间通常与 XMLSchema 的 URI 相同。命名空间示例如下所示。请注意,该命名看起来类似于一个 Internet URL。该命名标准由万维网联盟 (W3C) 建议,但并非必需。该 URI 用于唯一标识数据库中注册的 XMLSchema 的名称,而且无需是文档所处位置的物理 URL。
XMLType 方法和 XML 函数使用命名空间前缀。当 XML 文档没有目标命名空间时,该命名空间前缀将位于 noNameSpace 命名空间中。属性 xsi:noNamespaceSchemaLocation 可用于模式 URI。
如果元素不具备另一个命名空间前缀,默认情况下,在将某个命名空间应用到描述它的元素时,可使用该命名空间。
通常您将看到两个特定的命名空间。它们是 http://www.w3.org/2001/XMLSchema (完整的 XMLSchema 命名空间)和 http://xmlns.oracle.com/xdb (Oracle 提供的 XML DB 命名空间)。第二个命名空间具有写入基础 SQL 函数的函数。一些 XPath 函数也进行重写。例如 ora:contains、ceiling、floor、not、string-length、substring 和 translate。XML DB 使用的属性也属于该命名空间。
定义元素时,我们可以指定该元素的命名空间。在 XML 中,我们可以将它定义为
<elementName xmlns:ab="http.name.com" />
如您所见,我们提供了一个 elementName,它是我们将使用的元素(例如,“orders”)。Xmlns 是保留字,它告诉我们这是一个命名空间定义。“ab”部分称为前缀。该前缀是一个绑定到 URL 的简称。在本例中,ab 绑定到‘http.name.com’,而且 ab 可以加为元素名的前缀。
下面我们将创建一个非常小的模式,并声明绑定前缀 xs 到 http://www.w3.org/2001/XMLSchema 以及声明前缀 xdb 到 http://xmlns.oracle.com/xdb 。为了声明该命名空间,我们使用 xmlns 绑定它们。请注意,xs 前缀在本例中用在模式元素名称上。
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:xdb= "http://xmlns.oracle.com/xdb" version="1.0"> <xs:element name="INVOICESCHEMA" xdb:defaultTable="INVOICESCHEMA"> <xs:complexType> <xs:sequence> <xs:element name="MailAddressTo"> <xs:complexType> <xs:sequence> <xs:element name="Person" type="xs:string" <xs:element name="Street" type="xs:string"/> </xs:sequence> <xs:attribute name="id" type="xs:string" use="required"/> </xs:complexType> </xs:element> </xs:sequence> </xs:complexType> </xs:element> </xs:schema>
这里我们只是粗略介绍了一下命名空间。