19.E4X

E4X:2002 年,由BEA Systems 为首的几家公司建议为ECMAScript 增加一项扩展,以便在这门语言中添加原生的XML 支持。2004 年6 月,E4X(ECMAScript for XML)以ECMA-357 标准的形式发布;2005 年12 月又发布了修订版。E4X 本身不是一门语言,它只是ECMAScript 语言的可选扩展。就其本身而言,E4X 为处理XML 定义了新的语法,也定义了特定于XML 的对象。

尽管浏览器实现这个扩展标准的步伐非常缓慢,但Firefox 1.5及更高版本则支持几乎全部E4X标准。本章主要讨论Firefox 对E4X 的实现。

1.E4X 的类型:作为对ECMAScript 的扩展,E4X 定义了如下几个新的全局类型。

  1. XML:XML 结构中的任何一个独立的部分。
  2. XMLList:XML 对象的集合。
  3. Namespace:命名空间前缀与命名空间URI 之间的映射。
  4. QName:由内部名称和命名空间URI 组成的一个限定名。

E4X 定义的这个4 个类型可以表现XML 文档中的所有部分,其内部机制是将每一种类型(特别是XML 和XMLList)都映射为多个DOM 类型。

  • XML类型:XML 类型是E4X 中定义的一个重要的新类型,可以用它来表现XML 结构中任何独立的部分。XML的实例可以表现元素、特性、注释、处理指令或文本节点。XML 类型继承自Object 类型,因此它也继承了所有对象默认的所有属性和方法。创建XML 对象的方式不止一种,第一种方式是像下面这样调用其构造函数:
var x = new XML();

这行代码会创建一个空的XML 对象,我们能够向其中添加数据。另外,也可以向构造函数中传入一个XML 字符串,如下面的例子所示:

var x = new XML("<employee position=\"Software Engineer\"><name>Nicholas Zakas</name></employee>");

传入到构造函数中的XML 字符串会被解析为分层的XML 对象。除此之外,还可以向构造函数中传入DOM 文档或节点,以便它们的数据可以通过E4X 来表现,语法如下:

var x = new XML(xmldom);

虽然这些创建XML 对象的方式都还不错,但最强大也最吸引人的方法,则是使用XML 字面量将XML数据直接指定给一个变量。XML 字面量就是嵌入到JavaScript 代码中的XML 代码。下面来看一个例子。

var employee = <employee position="Software Engineer">
    <name>Nicholas C. Zakas</name>
</employee>;

在这个例子中,我们将一个XML 数据结构直接指定给了一个变量。这种简洁的语法同样可以创建一个XML 对象,并将它赋值给employee 变量。

Firefox 对E4X 的实现不支持解析XML 的开头代码(prolog)。无论<?xml version="1.0" ?>出现在传递给XML 构造函数的文本中,还是出现在XML 字面量中,都会导致语法错误。

XML 类型的toXMLString()方法会返回XML 对象及其子节点的XML 字符串表示。另一方面,该类型的toString()方法则会基于不同XML 对象的内容返回不同的字符串。如果内容简单(纯文本),则返回文本;否则,toString()方法与toXMLString()方法返回的字符串一样。来看下面的例子。

var data = <name>Nicholas C. Zakas</name>;
alert(data.toString()); //"Nicholas C. Zakas"
alert(data.toXMLString()); //"<name>Nicholas C. Zakas</name>"

使用这两个方法,几乎可以满足所有序列化XML 的需求。

  • XMLList类型:XMLList 类型表现XML 对象的有序集合。XMLList 的DOM 对等类型是NodeList,但与Node 和NodeList 之间的区别相比,XML 和XMLList 之间的区别是有意设计得比较小的。要显式地创建一个XMLList 对象,可以像下面这样使用XMLList 构造函数:
var list = new XMLList();

与XML 构造函数一样,也可以向其中传入一个待解析的XML 字符串。这个字符串可以不止包含一个文档元素,如下面的例子所示:

var list = new XMLList("<item/><item/>");

结果,保存在这个list 变量中的XMLList 就包含了两个XML 对象,分别是两个<item/>元素。

还可以使用加号(+)操作符来组合两个或多个XML 对象,从而创建XMLList 对象。加号操作符在E4X 中已经被重载,可以用于创建XMLList,如下所示:

var list = <item/> + <item/> ;

这个例子使用加号操作符组合了两个XML 字面量,结果得到一个XMLList。同样的组合操作也可以使用特殊的<>和</>语法来完成,此时不使用加号操作符,例如:

var list = <><item/><item/></>;

尽管可以创建独立的XMLList 对象,但是这类对象通常是在解析较大的XML 结构的过程中捎带着被创建出来的。来看下面的例子:

var employees = <employees>
	<employee position="Software Engineer">
		<name>Nicholas C. Zakas</name>
	</employee>
	<employee position="Salesperson">
		<name>Jim Smith</name>
	</employee>
</employees>;

以上代码定义的employees 变量中包含着一个XML 对象,表示<employees/>元素。由于这个元素又包含两个<employee/>元素,因而就会创建相应的XMLList 对象,并将其保存在employees.employee 中。然后,可以使用方括号语法及位置来访问每个元素:

var firstEmployee = employees.employee[0];
var secondEmployee = employees.employee[1];

每个XMLList 对象都有length()方法,用于返回对象中包含的元素数量。例如:

alert(employees.employee.length()); //2

注意,length()是方法,不是属性。这一点是故意与数组和NodeList 相区别的。

E4X 有意模糊XML 和XMLList 类型之间的区别,这一点很值得关注。实际上,一个XML 对象与一个只包含一个XML 对象的XMLList 之间,并没有显而易见的区别。为了减少两者之间的区别,每个XML对象也同样有一个length()方法和一个由[0]引用的属性(返回XML 对象自身)。

XML 与XMLList 之间的这种兼容性可以简化E4X 的使用,因为有些方法可以返回任意一个类型。

XMLList 对象的toString()和toXMLString()方法返回相同的字符串值,也就是将其包含的XML 对象序列化之后再拼接起来的结果。

  • Namespace类型:E4X 中使用Namespace 对象来表现命名空间。通常,Namespace 对象是用来映射命名空间前缀和命名空间URI 的,不过有时候并不需要前缀。要创建Namespace 对象,可以像下面这样使用Namespace构造函数:
var ns = new Namespace();

而传入URI 或前缀加URI,就可以初始化Namespace 对象,如下所示:

var ns = new Namespace("http://www.wrox.com/"); //没有前缀的命名空间
var wrox = new Namespace("wrox", "http://www.wrox.com/"); //wrox 命名空间

可以使用prefix 和uri 属性来取得Namespace 对象中的信息:

alert(ns.uri);         //"http://www.wrox.com/"
alert(ns.prefix);      //undefined
alert(wrox.uri);       //"http://www.wrox.com/"
alert(wrox.prefix);    //"wrox"

在没有给Namespace 对象指定前缀的情况下,prefix 属性会返回undefined。要想创建默认的命名空间,应该将前缀设置为空字符串。

如果XML 字面量中包含命名空间,或者通过XML 构造函数解析的XML 字符串中包含命名空间信息,那么就会自动创建Namespace 对象。然后,就可以通过前缀和namespace()方法来取得对Namespace对象的引用。来看下面的例子:

var xml = <wrox:root xmlns:wrox="http://www.wrox.com/">
            <wrox:message>Hello World!</wrox:message>
          </wrox:root>;
var wrox = xml.namespace("wrox");
alert(wrox.uri);
alert(wrox.prefix);

在这个例子中,我们以XML 字面量的形式创建了一个包含命名空间的XML 片段。而表现wrox 命名空间的Namespace 对象可以通过namespace("wrox") 取得,然后就可以访问这个对象的uri 和prefix 属性了。如果XML 片段中有默认的命名空间,那么向namespace()中传入空字符串,即可取得相应的Namespace 对象。

Namespace 对象的toString()方法始终会返回命名空间URI。

  • QName类型:QName 类型表现的是XML 对象的限定名,即命名空间与内部名称的组合。向QName 构造函数中传入名称或Namespace 对象和名称,可以手工创建新的QName 对象,如下所示:
var wrox = new Namespace("wrox", "http://www.wrox.com/");
var wroxMessage = new QName(wrox, "message"); //表示"wrox:message"

创建了QName 对象之后,可以访问它的两个属性:uri 和localName。其中,uri 属性返回在创建对象时指定的命名空间的URI(如果未指定命名空间,则返回空字符串),而localName 属性返回限定名中的内部名称,如下面的例子所示:

alert(wroxMessage.uri);             //"http://www.wrox.com/"
alert(wroxMessage.localName);       //"message"

这两个属性是只读的,如果你想修改它们的值,会导致错误发生。QName 对象重写了toString()方法,会以uri::localName 形式返回一个字符串,对于前面的例子来说,就是"http://www.wrox.com/::message"。

在解析XML 结构时,会为表示相应元素或特性的XML 对象自动创建QName 对象。可以使用这个XML对象的name()方法取得与该XML 对象关联的QName 对象,如下面的例子所示:

var xml = < wrox:root xmlns:wrox="http://www.wrox.com/">
            <wrox:message>Hello World!</wrox:message>
          </wrox:root> ;
var wroxRoot = xml.name();
alert(wroxRoot.uri);             //"http://www.wrox.com/"
alert(wroxRoot.localName);       //"root"

这样,即便没有指定命名空间信息,也会根据XML 结构中的元素和特性创建一个QName 对象。

使用setName()方法并传入一个新QName 对象,可以修改XML 对象的限定名,如下所示:

xml.setName(new QName("newroot"));

通常,这个方法会在修改相应命名空间下的元素标签名或特性名时用到。如果该名称不属于任何命名空间,则可以像下面这样使用setLocalName()方法来修改内部名称:

xml.setLocalName("newtagname");

2.一般用法:在将XML 对象、元素、特性和文本集合到一个层次化对象之后,就可以使用点号加特性或标签名的方式来访问其中不同的层次和结构。每个子元素都是父元素的一个属性,而属性名与元素的内部名称相同。如果子元素只包含文本,则相应的属性只返回文本,如下面的例子所示。

var employee = <employee position="Software Engineer">
                <name>Nicholas C. Zakas</name>
               </employee>;
alert(employee.name); //"Nicholas C. Zakas"

以上代码中的<name/>元素只包含文本。访问employee.name 即可取得该文本,而在内部需要定位到<name/>元素,然后返回相应文本。由于传入到alert()时,会隐式调用toString()方法,因此显示的是<name/>中包含的文本。这就使得访问XML 文档中包含的文本数据非常方便。如果有多个元素具有相同的标签名,则会返回XMLList。下面再看一个例子。

var employees = <employees>
		<employee position="Software Engineer">
			<name>Nicholas C. Zakas</name>
		</employee>
		<employee position="Salesperson">
			<name>Jim Smith</name>
		</employee>
	</employees>;
alert(employees.employee[0].name); //"Nicholas C. Zakas"
alert(employees.employee[1].name); //"Jim Smith"

这个例子访问了每个<employee/>元素并返回了它们<name/>元素的值。如果你不确定子元素的内部名称,或者你想访问所有子元素,不管其名称是什么,也可以像下面这样使用星号(*)。

var allChildren = employees.*;         //返回所有子元素,不管其名称是什么
alert(employees.*[0].name);            //"Nicholas C. Zakas"

与其他属性一样,星号也可能返回XML 对象,或返回XMLList 对象,这要取决于XML 结构。

要达到同样的目的,除了属性之外,还可以使用child()方法。将属性名或索引值传递给child()方法,也会得到相同的值。来看下面的例子。

var firstChild = employees.child(0); //与employees.*[0]相同
var employeeList = employees.child("employee"); //与employees.employee 相同
var allChildren = employees.child("*"); //与employees.*相同

为了再方便一些,还有一个children()方法始终返回所有子元素。例如:

var allChildren = employees.children(); //与employees.*相同

而另一个方法elements()的行为与child()类似,区别仅在于它只返回表示元素的XML 对象。例如:

var employeeList = employees.elements("employee"); //与employees.employee 相同
var allChildren = employees.elements("*");         //与employees.*相同

这些方法为JavaScript 开发人员提供了访问XML 数据的较为熟悉的语法。

要删除子元素,可以使用delete 操作符,如下所示:

delete employees.employee[0];
alert(employees.employee.length());         //1

显然,这也正是将子节点看成属性的一个主要的优点。

  • 访问特性:访问特性也可以使用点语法,不过其语法稍有扩充。为了区分特性名与子元素的标签名,必须在名称前面加上一个@字符。这是从XPath 中借鉴的语法;XPath 也是使用@来区分特性和标签的名称。不过,结果可能就是这种语法看起来比较奇怪,例如:
var employees = <employees>
					<employee position="Software Engineer">
						<name>Nicholas C. Zakas</name>
					</employee>
					<employee position="Salesperson">
						<name>Jim Smith</name>
					</employee>
				</employees>;
alert(employees.employee[0].@position); //"Software Engineer"

与元素一样,每个特性都由一个属性来表示,而且可以通过这种简写语法来访问。以这种语法访问特性会得到一个表示特性的XML 对象,对象的toString()方法始终会返回特性的值。要取得特性的名称,可以使用对象的name()方法。

另外,也可以使用child()方法来访问特性,只要传入带有@前缀的特性的名称即可。

alert(employees.employee[0].child("@position")); //"Software Engineer"

由于访问XML 对象的属性时也可以使用child(),因此必须使用@字符来区分标签名和特性名。

使用attribute()方法并传入特性名,可以只访问XML 对象的特性。与child()方法不同,使用attribute()方法时,不需要传入带@字符的特性名。下面是一个例子。

alert(employees.employee[0].attribute("position"));         //"Software Engineer"

这三种访问特性的方式同时适用于XML 和XMLList 类型。对于XML 对象来说,会返回一个表示相应特性的XML 对象;对XMLList 对象来说,会返回一个XMLList 对象,其中包含列表中所有元素的特性XML 对象。对于前面的例子而言,employees.employee.@position 返回的XMLList 将包含两个对象:一个对象表示第一个<employee/>元素中的position 特性,另一个对象表示第二个元素中的同一特性。

要取得XML 或XMLList 对象中的所有特性,可以使用attributes()方法。这个方法会返回一个表示所有特性的XMLList 对象。使用这个方法与使用@*的结果相同,如下面的例子所示。

//下面两种方式都会取得所有特性
var atts1 = employees.employee[0].@*;
var atts2 = employees.employee[0].attributes();

在E4X 中修改特性的值与修改属性的值一样非常简单,只要像下面这样为特性指定一个新值即可。

employees.employee[0].@position = "Author"; //修改position 特性

修改的特性会在内部反映出来,换句话说,此后再序列化XML 对象,就会使用新的特性值。同样,为特性赋值的语法也可以用来添加新特性,如下面的例子所示。

employees.employee[0].@experience = "8 years"; //添加experience 特性
employees.employee[0].@manager = "Jim Smith"; //添加manager 特性

由于特性与其他ECMAScript 属性类似,因此也可以使用delete 操作符来删除特性,如下所示。

delete employees.employee[0].@position; //删除 position 特性

通过属性来访问特性极大地简化了与底层XML 结构交互的操作。

  • 其他节点类型:E4X 定义了表现XML 文档中所有部分的类型,包括注释和处理指令。在默认情况上,E4X 不会解析注释或处理指令,因此这些部分不会出现在最终的对象层次中。如果想让解析器解析这些部分,可以像下面这样设置XML 构造函数的下列两个属性。
XML.ignoreComments = false;
XML.ignoreProcessingInstructions = false;

在设置了这两个属性之后,E4X 就会将注释和处理指令解析到XML 结构中。

由于XML 类型可以表示所有节点,因此必须有一种方式来确定节点类型。使用nodeKind()方法可以得到XML 对象表示的类型,该访问可能会返回"text"、"element"、"comment"、"processing-instruction"或"attribute"。以下面的XML 对象为例。

var employees = <employees>
					<?Dont forget the donuts?>
					<employee position="Software Engineer">
						<name>Nicholas C. Zakas</name>
					</employee>
					<!--just added-->
					<employee position="Salesperson">
						<name>Jim Smith</name>
					</employee>
				</employees> ;

我们可以通过下面的表格来说明nodeKind()返回的节点类型。

语句返回值
employees.nodeKind()element
employees.*[0].nodeKind()processing-instruction
employees.employee[0].@position.nodeKind()attribute
employees.employee[0].nodeKind()element
employees.*[2].nodeKind()comment
employees.employee[0].name.*[0].nodeKind()text

不能在包含多个XML 对象的XMLList 上调用nodeKind()方法;否则,会抛出一个错误。

可以只取得特定类型的节点,而这就要用到下列方法。

  1. attributes():返回XML 对象的所有特性。
  2. comments():返回XML 对象的所有子注释节点。
  3. elements(tagName):返回XML 对象的所有子元素。可以通过提供元素的tagName(标签名)来过滤想要返回的结果。
  4. processingInstructions(name):返回XML 对象的所有处理指令。可以通过提供处理指令的name(名称)来过滤想要返回的结果。
  5. text():返回XML 对象的所有文本子节点。

上述的每一个方法都返回一个包含适当XML 对象的XMLList。

使用hasSimpleContent()和hasComplexContent()方法,可以确定XML 对象中是只包含文本,还是包含更复杂的内容。如果XML 对象中只包含子文本节点,则前一个方法会返回true;如果XML 对象的子节点中有任何非文本节点,则后一个方法返回true。来看下面的例子。

alert(employees.employee[0].hasComplexContent());        //true
alert(employees.employee[0].hasSimpleContent());         //false
alert(employees.employee[0].name.hasComplexContent());   //false
alert(employees.employee[0].name.hasSimpleContent());    //true

利用这些方法,以及前面提到的其他方法,可以极大地方便查找XML 结构中的数据。

  • 查询:实际上,E4X 提供的查询语法在很多方面都与XPath 类似。取得元素或特性值的简单操作是最基本的查询。在查询之前,不会创建表现XML文档结构中不同部分的XML 对象。从底层来看,XML 和XMLList的所有属性事实上都是查询的结果。也就是说,引用不表现XML 结构中某一部分的属性仍然会返回XMLList;只不过这个XMLList 中什么也不会包含。例如,如果基于前面的XML 示例执行下列代码,则返回的结果就是空的。
var cats = employees.cat;
alert(cats.length()); //0

这个查询想要查找<employees/>中的<cat/>元素,但这个元素并不存在。上面的第一行代码会返回一个空的XMLList 对象。虽然返回的是空对象,但查询可以照常进行,而不会发生异常。

前面我们看到的大多数例子都使用点语法来访问直接的子节点。而像下面这样使用两个点,则可以进一步扩展查询的深度,查询到所有后代节点。

var allDescendants = employees..*; //取得<employees/>的所有后代节点

上面的代码会返回<employees/>元素的所有后代节点。结果中将会包含元素、文本、注释和处理指令,最后两种节点的有无取决于在XML 构造函数上的设置(前面曾经讨论过);但结果中不会包含特性。要想取得特定标签的元素,需要将星号替换成实际的标签名。

var allNames = employees..name; //取得作为<employees/>后代的所有<name/>节点

同样的查询可以使用descendants()方法来完成。在不给这个方法传递参数的情况下,它会返回所有后代节点(与使用..*相同),而传递一个名称作为参数则可以限制结果。下面就是这两种情况的例子。

var allDescendants = employees.descendants(); //所有后代节点
var allNames = employees.descendants("name"); //后代中的所有<name/>元素

还可以取得所有后代元素中的所有特性,方法是使用下列任何一行代码。

var allAttributes = employees..@*;                 //取得所有后代元素中的所有特性
var allAttributes2 = employees.descendants("@*");  //同上

与限制结果中的后代元素一样,也可以通过用完整的特性名来替换星号达到过滤特性的目的。例如:

var allAttributes = employees..@position;                 //取得所有position 特性
var allAttributes2 = employees.descendants("@position");  //同上

除了访问后代元素之外,还可以指定查询的条件。例如,要想返回position 特性值为"Salesperson"的所有<employee/>元素,可以使用下面的查询:

var salespeople = employees.employee.(@position == "Salesperson");

同样的语法也可以用于修改XML 结构中的某一部分。例如,可以将第一位销售员(salesperson)的position 特性修改为"Senior Salesperson",代码如下:

employees.employee.(@position == "Salesperson")[0].@position= "Senior Salesperson";

注意,圆括号中的表达式会返回一个包含结果的XMLList,而方括号返回其中的第一项,然后我们重写了@position 属性的值。

使用parent()方法能够在XML 结构中上溯,这个方法会返回一个XML 对象,表示当前XML 对象的父元素。如果在XMLList 上调用parent()方法,则会返回列表中所有对象的公共父元素。下面是一个例子。

var employees2 = employees.employee.parent();

这里,变量employees2 中包含着与变量employees 相同的值。在处理来源未知的XML 对象时,经常会用到parent()方法。

  • 构建和操作XML:将XML 数据转换成XML 对象的方式有很多种。前面曾经讨论过,可以将XML 字符串传递到XML构造函数中,也可以使用XML 字面量。相对而言,XML 字面量方式更方便一些,因为可以在字面量中嵌入JavaScript 变量,语法是使用花括号({})。可以将JavaScript 变量嵌入到字面量中的任意位置上,如下面的例子所示。
var tagName = "color";
var color = "red";
var xml = <{tagName}>{color}</{tagName}>;
alert(xml.toXMLString()); //"<color>red</color>

在这个例子中,XML 字面量的标签名和文本值都是使用花括号语法插入的。有了这个语法,就可以省去在构建XML 结构时拼接字符串的麻烦。

E4X 也支持使用标准的JavaScript 语法来构建完整的XML 结构。如前所述,大多数必要的操作都是查询,而且即便元素或特性不存在也不会抛出错误。在此基础上更进一步,如果将一个值指定给一个不存在的元素或特性,E4X 就会首先在底层创建相应的结构,然后完成赋值。来看下面的例子。

var employees = <employees/>;
employees.employee.name = "Nicholas C. Zakas";
employees.employee.@position = "Software Engineer";

这个例子一开始声明了<employees/>元素,然后在这个元素基础上开始构建XML 结构。第二行代码在<employees/>中创建了一个<employee/>元素和一个<name/>元素,并指定了文本值。第三行代码添加了一个position 特性并为该特性指定了值。此时构建的XML 结构如下所示。

<employees>
    <employee position="Software Engineer">
        <name>Nicholas C. Zakas</name>
    </employee>
</employees>

当然,使用加号操作符也可以再添加一个<employee/>元素,如下所示。

employees.employee += <employee position="Salesperson">
                        <name>Jim Smith</name>
                      </employee>;

最终构建的XML 结构如下所示:

<employees>
	<employee position="Software Engineer">
		<name>Nicholas C. Zakas</name>
	</employee>
	<employee position="Salesperson">
		<name>Jim Smith</name>
	</employee>
</employees>

除了上面介绍的基本的XML 构建语法之外,还有一些类似DOM 的方法,简介如下。

  1. appendChild(child):将给定的child 作为子节点添加到XMLList 的末尾。
  2. copy():返回XML 对象副本。
  3. insertChildAfter(refNode, child):将child 作为子节点插入到XMLList 中refNode 的后面。
  4. insertChildBefore(refNode, child):将child 作为子节点插入到XMLList 中refNode 的前面。
  5. prependChild(child):将给定的child 作为子节点添加到XMLList 的开始位置。
  6. replace(propertyName, value):用value 值替换名为propertyName 的属性,这个属性可能是一个元素,也可能是一个特性。
  7. setChildren(children):用children 替换当前所有的子元素,children 可以是XML 对象,也可是XMLList 对象。

这些方法既非常有用,也非常容易使用。下列代码展示了这些方法的用途。

var employees = 
<employees>
	<employee position="Software Engineer">
		<name>Nicholas C. Zakas</name>
	</employee>
	<employee position="Salesperson">
		<name>Jim Smith</name>
	</employee>
</employees>;

employees.appendChild(<employee position="Vice President">
						<name>Benjamin Anderson</name>
					</employee>);

employees.prependChild(<employee position="User Interface Designer">
						<name>Michael Johnson</name>
					</employee>);

employees.insertChildBefore(employees.child(2),
	<employee position="Human Resources Manager">
		<name>Margaret Jones</name>
	</employee>);

employees.setChildren(<employee position="President">
						<name>Richard McMichael</name>
					</employee> +
					<employee position="Vice President">
						<name>Rebecca Smith</name>
					</employee>);

以上代码首先在员工列表的底部添加了一个名为Benjamin Anderson 的副总统(vice president)。然后,在员工列表顶部又添加了一个名为Michael Johnson 的界面设计师。接着,在列表中位置为2 的员工——此时这个员工是Jim Smith,因为他前面还有Michael Johnson 和Nicholas C. Zakas——之前又添加了一个名为Margaret Jones 的人力资源部经理。最后,所有这些子元素都被总统Richard McMichael 和副总统Rebecca Smith 替代。结果XML 如下所示。

<employees>
	<employee position="President">
		<name>Richard McMichael</name>
	</employee>
	<employee position="Vice President">
		<name>Rebecca Smith</name>
	</employee>
</employees>

熟练运用这些技术和方法,就能够使用E4X 执行任何DOM风格的操作。

  • 解析和序列化:E4X 将解析和序列化数据的控制放在了XML 构造函数的一些设置当中。与XML 解析相关的设置有如下三个。
  1. ignoreComments:表示解析器应该忽略标记中的注释。默认设置为true。
  2. ignoreProcessingInstructions:表示解析器应该忽略标记中的处理指令。默认设置为true。
  3. ignoreWhitespace:表示解析器应该忽略元素间的空格,而不是创建表现这些空格的文本节点。默认设置为true。

这三个设置会影响对传入到XML 构造函数中的字符串以及XML 字面量的解析。

另外,与XML 数据序列化相关的设置有如下两个。

  1. prettyIndent:表示在序列化XML 时,每次缩进的空格数量。默认值为2。
  2. prettyPrinting:表示应该以方便人类认读的方式输出XML,即每个元素重起一行,而且子元素都要缩进。默认设置为true。

这两个设置将影响到toString()和toXMLString()的输出。

以上五个设置都保存在settings 对象中,通过XML 构造函数的settings()方法可以取得这个对象,如下所示。

var settings = XML.settings();
alert(settings.ignoreWhitespace); //true
alert(settings.ignoreComments); //true

通过向setSettings()方法中传入包含全部5 项设置的对象,可以一次性指定所有设置。在需要临时改变设置的情况下,这种设置方式非常有用,如下所示。

var settings = XML.settings();
XML.prettyIndent = 8;
XML.ignoreComments = false;
//执行某些处理
XML.setSettings(settings); //重置前面的设置

而使用defaultSettings()方法则可以取得一个包含默认设置的对象,因此任何时候都可以使用下面的代码重置设置。

XML.setSettings(XML.defaultSettings());
  • 命名空间:E4X 提供了方便使用命名空间的特性。前面曾经讨论过,使用namspace()方法可以取得与特定前缀对应的Namespace 对象。而通过使用setNamespace()并传入Namespace 对象,也可以为给定元素设置命名空间。来看下面的例子。
var messages = <messages>
                <message>Hello world!</message>
                </messages>;
messages.setNamespace(new Namespace("wrox", "http://www.wrox.com/"));

调用setNamespace()方法后,相应的命名空间只会应用到调用这个方法的元素。此时,序列化messages 变量会得到如下结果。

<wrox:messages xmlns:wrox="http://www.wrox.com/">
    <message>Hello world!</message>
</wrox:messages>

可见,由于调用了setNamespace()方法,<messages/>元素有了wrox 命名空间前缀,而<message/>元素则没有变化。

如果只想添加一个命名空间声明,而不想改变元素,可以使用addNamespace()方法并传入Namespace 对象,如下面的例子所示。

messages.addNamespace(new Namespace("wrox", "http://www.wrox.com/"));

在将这行代码应用于原先的<messages/>元素时,就会创建如下所示的XML 结构。

<messages xmlns:wrox="http://www.wrox.com/">
    <message>Hello world!</message>
</messages>

调用removeNamespace()方法并传入Namespace 对象,可以移除表示特定命名空间前缀和URI的命名空间声明;注意,必须传入丝毫不差的表示命名空间的Namespace 对象。例如:

messages.removeNamespace(new Namespace("wrox", "http://www.wrox.com/"));

这行代码可以移除wrox 命名空间。不过,引用前缀的限定名不会受影响。

有两个方法可以返回与节点相关的Namespace 对象的数组:namespaceDeclarations()和inScopeNamespaces()。前者返回在给定节点上声明的所有命名空间的数组,后者返回位于给定节点作用域中(即包括在节点自身和祖先元素中声明的)所有命名空间的数组。如下面的例子所示:

var messages = <messages xmlns:wrox="http://www.wrox.com/">
                   <message>Hello world!</message>
               </messages>;

alert(messages.namespaceDeclarations()); //"http://www.wrox.com"
alert(messages.inScopeNamespaces()); //",http://www.wrox.com"
alert(messages.message.namespaceDeclarations()); //""
alert(messages.message.inScopeNamespaces()); //",http://www.wrox.com"

这里,<messages/>元素在调用namespaceDeclarations()时,会返回包含一个命名空间的数组而在调用inScopeNamespaces()时,则会返回包含两个命名空间的数组。作用域中的这两个命名空间,分别是默认命名空间(由空字符串表示)和wrox 命名空间。在<message/>元素上调用这些方法时,namespaceDeclarations(),会返回一个空数组,而inScopeNamespaces()方法返回的结果与在<messages/>元素上调用时的返回结果相同。

使用双冒号(::)也可以基于Namespace 对象来查询XML 结构中具有特定命名空间的元素。例如,要取得包含在wrox 命名空间中的所有<message/>元素,可以参考下面的代码。

var messages = <messages xmlns:wrox="http://www.wrox.com/">
                <wrox:message>Hello world!</message>
               </messages>;

var wroxNS = new Namespace("wrox", "http://www.wrox.com/");
var wroxMessages = messages.wroxNS::message;

这里的双冒号表示返回的元素应该位于其中的命名空间。注意,这里使用的是JavaScript 变量,而不是命名空间前缀。

还可以为某个作用域中的所有XML 对象设置默认命名空间。为此,要使用default xml namespace语句,并将一个Namespace 对象或一个命名空间URI 作为值赋给它。例如:

default xml namespace = "http://www.wrox.com/";
function doSomething(){
    //只为这个函数设置默认的命名空间
    default xml namespace = new Namespace("your", "http://www.yourdomain.com");
}

在doSomething()函数体内设置默认命名空间并不会改变全局作用域中的默认XML 命名空间。在给定作用域中,当所有XML 数据都需要使用特定的命名空间时,就可以使用这个语句,从而避免多次引用命名空间的麻烦。

3.其他变化:为了与ECMAScript 做到无缝集成,E4X 也对语言基础进行了一些修改。其中之一就是引入了for-each-in 循环,以便迭代遍历每一个属性并返回属性的值,如下面的例子所示。

var employees =
<employees>
	<employee position="Software Engineer">
		<name>Nicholas C. Zakas</name>
	</employee>
	<employee position="Salesperson">
		<name>Jim Smith</name>
	</employee>
</employees>;
for each (var child in employees){
	alert(child.toXMLString());
}

在这个例子的for-each-in 循环中,<employees/>的每个子节点会依次被赋值给child 变量,其中包括注释、处理指令和/或文本节点。要想返回特性节点,则需要对一个由特性节点组成的XMLList对象进行操作,如下所示。

for each (var attribute in employees.@*){ //遍历特性
    alert(attribute);
}

虽然for-each-in 循环是在E4X 中定义的,但这个语句也可以用于常规的数组和对象,例如:

var colors = ["red","green","blue"];
for each(var color in colors){
	alert(color);
}

对于数组,for-each-in 循环会返回数组中的每一项。对于非XML 对象,这个循环返回对象每个属性的值。

E4X 还添加了一个全局函数,名叫isXMLName()。这个函数接受一个字符串,并在这个字符串是元素或特性的有效内部名称的情况下返回true。在使用未知字符串构建XML 数据结构时,这个函数可以为开发人员提供方便。来看下面的例子。

alert(isXMLName("color"));             //true
alert(isXMLName("hello world"));       //false

如果你不确定某个字符串的来源,而又需要将该字符串用作一个内部名称,那么最好在使用它之前先通过isXMLName()检测一下是否有效,以防发生错误。

E4X 对标准ECMAScript 的最后一个修改是typeof 操作符。在对XML 对象或XMLList 对象使用这个操作符时,typeof 返回字符串"xml"。但在对其他对象使用这个操作符时,返回的都是"object",例如:

var xml = new XML();
var list = new XMLList();
var object = {};

alert(typeof xml); //"xml"
alert(typeof list); //"xml"
alert(typeof object); //"object"

多数情况下,都没有必要区分XML 和XMLList 对象。在E4X 中,这两个对象都被看成是基本数据类型,因而也无法通过instanceof 操作符来将它们区分开来。

4.全面启用E4X:鉴于E4X 在很多方面给标准JavaScript 带来了不同,因此Firefox 在默认情况下只启用E4X 中与其他代码能够相安无事的那些特性。要想完整地启用E4X,需要将<script>标签的type 特性设置为"text/javascript;e4x=1",例如:

<script type="text/javascript;e4x=1" src="e4x_file.js"></script>

在打开这个“开关”之后,就会全面启用E4X,从而能够正确地解析嵌入在E4X 字面量中的注释和CData 片段。在没有完整启用E4X 的情况下使用注释和/或CData 片段会导致语法错误。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值