DOM 文档对象模型

最新推荐文章于 2024-11-09 22:15:42 发布

sukyle

最新推荐文章于 2024-11-09 22:15:42 发布

阅读量386

点赞数

分类专栏： AJAX 文章标签：文档 xml api transformation encoding microsoft

AJAX 专栏收录该内容

42 篇文章 0 订阅

订阅专栏

DOM(Document Object Model)

　　DOM是Document Object Model文档对象模型的缩写。根据W3C DOM规范（http://www.w3.org/DOM/），DOM是一种与浏览器，平台，语言无关的接口，使得你可以访问页面其他的标准组件。简单理解，DOM解决了Netscape的Javascript和Microsoft的Jscript之间的冲突，给予web设计师和开发者一个标准的方法，让他们来访问他们站点中的数据、脚本和表现层对像。
　　DOM是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中导航寻找特定信息。分析该结构通常需要加载整个文档和构造层次结构，然后才能做任何工作。由于它是基于信息层次的，因而 DOM 被认为是基于树或基于对象的。
　　对于特别大的文档，解析和加载整个文档可能很慢且很耗资源，因此使用其他手段来处理这样的数据会更好。这些基于事件的模型，比如 Simple API for XML（SAX），适用于处理数据流，即随着数据的流动而依次处理数据。基于事件的 API 消除了在内存中构造树的需要，但是却不允许开发人员实际更改原始文档中的数据。
　　SAX等模型会从头至尾的顺序解析整个XML文档，当遇到一个节点的开始或或者结束时，会产生一个事件，程序员可以注册事件处理函数以对各个节点进行处理。
　　另一方面，DOM 还提供了一个 API，允许开发人员添加、编辑、移动或删除树中任意位置的节点，从而创建一个引用程序。这个模型就是基于树型数据结构的，他在使用之前必须加载整个文档或者至少是结构良好的文档片段
　　解析器是一个软件应用程序，设计用于分析文档（这里是指 XML 文件），以及做一些特定于该信息的事情。在诸如 SAX 这样基于事件的 API 中，解析器将向某种监听器发送事件。在诸如 DOM 这样基于树的 API 中，解析器将在内存中构造一颗数据树。
　　作为 API 的 DOM
　　从 DOM Level 1 开始，DOM API 包含了一些接口，用于表示可从 XML 文档中找到的所有不同类型的信息。它还包含使用这些对象所必需的方法和属性。
　　Level 1 包括对 XML 1.0 和 HTML 的支持，每个 HTML 元素被表示为一个接口。它包括用于添加、编辑、移动和读取节点中包含的信息的方法，等等。然而，它没有包括对 XML 名称空间（XML Namespace）的支持，XML 名称空间提供分割文档中的信息的能力。
　　DOM Level 2 添加了名称空间支持。Level 2 扩展了 Level 1，允许开发人员检测和使用可能适用于某个节点的名称空间信息。Level 2 还增加了几个新的模块，以支持级联样式表、事件和增强的树操作。
　　当前正处于定稿阶段的 DOM Level 3 包括对创建 Document 对象（以前的版本将这个任务留给实现，使得创建通用应用程序很困难）的更好支持、增强的名称空间支持，以及用来处理文档加载和保存、验证以及 XPath 的新模块；XPath 是在 XSL 转换（XSL Transformation）以及其他 XML 技术中用来选择节点的手段。
　　DOM 的模块化意味着作为开发人员，您必须知道自己希望使用的特性是否受正在使用的 DOM 实现所支持。
　　确定特性可用性
　　DOM 推荐标准的模块性质允许实现者挑选将要包括到产品中的部分，因而在使用某个特定的特性之前，首先确定该特性是否可用可能是必要的。本教程仅使用 DOM Level 2 Core API，不过在着手您自己的项目时，了解如何能够检测特性是有所帮助的。
　　DOM 中定义的接口之一就是 DOMImplementation。通过使用 hasFeature() 方法，您可以确定某个特定的特性是否受支持。DOM Level 2 中不存在创建DOMImplementation 的标准方法，不过下面的代码将展示如何使用 hasFeature() 来确定 DOM Level 2 样式表模块在某个 Java 应用程序中是否受支持。
　　import javax.xml.parsers.DocumentBuilderFactory;
　　import javax.xml.parsers.DocumentBuilder;
　　import org.w3c.dom.DOMImplementation;
　　public class ShowDomImpl {
　　public static void main (String args[]) {
　　try {
　　DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
　　DocumentBuilder docb = dbf.newDocumentBuilder();
　　DOMImplementation domImpl = docb.getDOMImplementation();
　　if (domImpl.hasFeature("StyleSheets", "2.0")) {
　　System.out.println("Style Sheets are supported.");
　　} else {
　　System.out.println("Style Sheets are not supported.");
　　}
　　} catch (Exception e) {}
　　}
　　}
　　（DOM Level 3 将包括用于创建 DOMImplementation 的标准方法。）
　　本教程将使用单个文档来展示 DOM Level 2 Core API 的对象和方法。
　　基本的 XML 文件
　　本教程中的所有例子都是用了一个包含如下节点的 XML 文件，它表示输入某个商业系统的订单。回顾一下，XML 文件的基本组成部分包括：
　　XML 声明：基本的声明 <?xml version="1.0" encoding="UTF-8"?> 将这个文件定义为 XML 文档。在声明中指定一种字符编码的情况并不鲜见，如下所示。通过这种方式，不管该 XML 文件使用的语言或字符编码是什么，只要解析器理解特定的编码，它就能够正确地读取该 XML 文件。
　　DOCTYPE 声明：XML 是人机之间交换信息的便利手段，但是要使它能够顺利地工作，必须要有一个公共的词汇表。可选的 DOCTYPE 声明可用于指定一个应该用来与此文件做比较的文档（在本例中为 orders.dtd），以确保不会产生任何混淆或丢失信息（例如，丢失一个 userid 或错误拼写某个元素名称）。以这种方式处理过的文档称为有效的文档。成功的有效性检查并不是 XML 所必需的，后面的例子实际上从文档中省略了 DOCTYPE 声明。
　　数据本身：XML 文档中的数据必须包含在单个根元素内，比如下面的 orders 元素。要使 XML 文档得到处理，它必须是格式良好的（well-formed）。
　　<?xml version="1.0" encoding="UTF-8"?>
　　<!DOCTYPE ORDERS SYSTEM "orders.dtd">
　　<orders>
　　<order>
　　<customerid limit="1000">12341</customerid>
　　<status>pending</status>
　　<item instock="Y" itemid="SA15">
　　<name>Silver Show Saddle, 16 inch</name>
　　<price>825.00</price>
　　<qty>1</qty>
　　</item>
　　<item instock="N" itemid="C49">
　　<name>Premium Cinch</name>
　　<price>49.00</price>
　　<qty>1</qty>
　　</item>
　　</order>
　　<order>
　　<customerid limit="150">251222</customerid>
　　<status>pending</status>
　　<item instock="Y" itemid="WB78">
　　<name>Winter Blanket (78 inch)</name>
　　<price>20</price>
　　<qty>10</qty>
　　</item>
　　</order>
　　</orders>
　　在 DOM 中，使用 XML 信息意味着首先将它划分为节点。
　　DOM是domain object model（域对象模型）的缩写
　　DOM的优缺点
　　
　　DOM的优势主要表现在：易用性强，使用DOM时，将把所有的XML文档信息都存于内存中，并且遍历简单，支持XPath，增强了易用性。
　　DOM的缺点主要表现在：效率低，解析速度慢，内存占用量过高，对于大文件来说几乎不可能使用。另外效率低还表现在大量的消耗时间，因为使用DOM进行解析时，将为文档的每个element、attribute、processing- instrUCtion和comment都创建一个对象，这样在DOM机制中所运用的大量对象的创建和销毁无疑会影响其效率。