XML就是指可扩展标记语言(eXtensible Markup Language),标准通用标记语言的子集,一种用于标记电子文件使其具有结构性的标记语言。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。
XML的解析器主要有DOM和SAX两种,如下:
- SAX解析器是基于事件处理的,需要从头到尾把XML文档扫描一遍,在扫描的过程中,每次遇到一个语法结构时,就会调用这个特定语法结构的事件处理程序,向应用程序发送一个事件。
- DOM是文档对象模型解析,构建文档的分层语法结构,在内存中建立DOM树,DOM树的节点以对象的形式来标识,文档解析文成以后,文档的整个DOM树都会放在内存中。
Ruby中对XML的文档的解析可以使用这个库REXML库,这个库是ruby的一个XML工具包,是使用纯Ruby语言编写的,遵守XML1.0规范。在Ruby1.8版本及其以后,RUBY标准库中将包含REXML。REXML库的路径是: rexml/document,所有的方法和类都被封装到一个REXML模块内。REXML解析器比其他的解析器有以下优点:
- 100% 由 Ruby 编写。
- 可适用于 SAX 和 DOM 解析器。
- 它是轻量级的,不到2000行代码。
- 很容易理解的方法和类。
- 基于 SAX2 API 和完整的 XPath 支持。
- 使用 Ruby 安装,而无需单独安装。
接下来,我们先将下列代码保存为.xml后缀的文件: