10.1.2 Document 类型
JavaScript 通过 Document 类型表示文档。在浏览器中,document 对象是 HTMLDocument (继承自 Document 类型) 的一个实例,表示整个 HTML 页面。而且,document 对象是 window 对象的一个属性,因此可以将其作为全局对象来访问。Document 节点具有下列特征:
Document 类型可以表示 HTML 页面或者其他基于 XML 的文档。不过,最常见的应用还是作为 HTMLDocument 实例的 document 对象。通过这个文档对象,不仅可以取得与页面有关的信息,而且还能操作页面的外观及其底层结构。
除了 IE 之外,可以在任何浏览器中通过脚本访问 Document 类型的构造函数和原型。但在所有浏览器中都可以访问 HTMLDocument 类型的构造函数和原型,包括 IE8 及后续版本。
1.文档的子节点
虽然 DOM 标准规定 Document 节点的子节点可以是 DocumentType、Element、ProcessingInstruction 或 Comment,但还有两个内置的访问其子节点快捷方式。第一个就是 documentElement 属性,该属性始终指向 HTML 页面中的 <html> 元素。另一个就是通过 childNodes 列表访问文档元素,但通过 documentElement 属性则能更快捷、更直接地访问该元素。以下面这个简单的页面为例:
<html>
<body>
</body>
</html>
这个页面在经过浏览器解析后,其文档中只包含一个子节点,即 <html> 元素。可以通过 documentElement 或 childNodes 列表来访问这个元素,如下所示:
var html = document.documentElement; // 取得对 <html> 的引用
alert(html == document.childNodes[0]); // true
alert(html == document.firstChild); // true
这个例子说明,documentElement、firstChild 和 childNodes[0] 的值相同,都指向 <html> 元素。
作为 HTMLDocument 的实例,document 对象还有一个 body 属性,直接指向 <body> 元素。因为开发人员经常要使用这个元素,所以 document.body 在 JavaScript 代码中出现的频率非常高,其用法如下:
var body = document.body; // 取得对 <body> 的引用
所有浏览器都支持 document.documentElement 和 document.body 属性。
Document 另一个可能的子节点是 DocumentType 。通常将 <!DOCTYPE> 标签看成一个与文档其他部分不同的实体,可以通过 doctype 属性 (在浏览器中是 document.doctype) 来访问它的信息:
var doctype = document.doctype; // 取得对 <!DOCTYPE> 的引用
浏览器对 document.doctype 的支持差别很大,可以给出如下总结。
- IE : 如果存在文档类型声明,会将其错误地解释为一个注释并把它当作 Comment 节点;而 document.doctype 的值始终为 null。
- Firefox : 如果存在文档类型声明,则将其作为文档的第一个子节点;document.doctype 是一个 DocumentType 节点,也可以通过 document.firstChild 或 document.childNodes[0] 访问同一个节点。
- Safari、Chrome 和 Opera : 如果存在文档类型声明,则将其解析,但不作为文档的子节点。document.doctype 是一个 DocumentType 节点,但该节点不会出现在 document.childNodes 中
- IE、Safari 3.1 及更高版本、Opera 和 Chrome 只为第一条注释创建节点,不为第二条注释创建节点。结果,第一条注释就会成为 document.childNodes 中的第一个子节点。
- Firefox 以及 Safari 3.1 之前的版本会完全忽略这两条注释。
可以使用下面的代码取得这个元素:
var div = document.getElementById("myDiv"); // 取得 <div>元素的引用
但是,下面的代码在除IE之外的所有浏览器中都将返回 null:
var div = document.getElementById("mydiv"); // 无效的ID (在IE中可以)
IE8及较低版本不区分ID的大小写,因此 "myDiv" 和 "mydiv" 会被当作相同的元素 ID 。运行在 IE7兼容模式下的IE8 (此时 document.documentMode 值为7) 也是如此。
如果页面中多个元素的ID值相同,getElementById()只返回文档中第一次出现的元素。IE7及较低版本还为此方法添加了一个有意思的“怪癖”:name 特性与给定ID匹配的表单元素 (<input>、<textarea>、<button>及<select>)也会被该方法返回。如果有哪个表单元素的 name 特性等于指定的ID,而且该元素在文档中位于带有给定ID的元素前面,那么IE就会返回那个表单元素。来看下面的例子:
<input type="text" name="myElement" value="Text field" >
<div id="myElement">A div</div>
基于这段HTML代码,在IE7中调用 document.getElementById("myElement"),结果会返回 <input>元素;而在其他所有浏览器中,都会返回对 <div> 元素的引用。为了避免IE中存在的这个问题,最好的办法是不让表单字段的name特性与其他元素的ID相同。
(2)另一个常用于取得元素引用的方法是 getElementsByTagName()。这个方法接受一个参数,即要取得元素的标签名,而返回的是包含零或多个元素的 NodeList。在HTML文档中,这个方法会返回一个 HTMLCollection 对象,作为一个 "动态" 集合,该对象与 NodeList 非常类似。例如,下列代码会取得页面中所有的 <img> 元素,并返回一个 HTMLCollection:
var images = document.getElementsByTagName("img");
这行代码会将一个 HTMLCollection 对象保存在 images 变量中。与 NodeList 对象类似,可以使用方括号语法或 item() 方法来访问 HTMLCollection 对象中的项。而这个对象中元素的数量则可以通过其 length 属性取得,如下面的例子所示:
alert(images.length); // 输出图像的数量
alert(images[0].src); // 输出第一个图像元素的 src 特性
alert(images.item(0).src); // 输出第一个图像元素的 src 特性
HTMLCollection 对象还有一个方法,叫做 namedItem(),使用这个方法可以通过元素的 name 特性取得集合中的项。例如,假设上面提到的页面中包含如下 <img> 元素:
<img src="myimage.gif" name="myImage" >
那么就可以通过如下方式从 images 变量中取得这个 <img> 元素:
var myImage = images.namedItem("myImage");
在提供按索引访问项的基础上,HTMLCollection 还支持按名称访问项,这就为我们取得实际想要的元素提供了便利。而且,对命名的项也可以使用方括号语法来访问,如下所示:
var myImage = images["myImage"];
对 HTMLCollection 而言,我们可以向方括号中传入 数值或字符串形式的索引值。在后台,对数值索引就会调用 item(),而对字符串索引就会调用 namedItem() 。
要想取得文档中的所有元素,可以向 getElementsByTagName()中传入 "*" 。在 JavaScript 及 CSS 中,星号 (*) 通常表示 “全部”。下面看一个例子:
var allElements = document.getElementsByTagName("*");
仅此一行代码返回的 HTMLCollection 中,就包含了整个页面中的所有元素 -- 按照它们出现的先后顺序。换句话说,第一项是 <html> 元素,第二项是 <head> 元素,以此类推。由于 IE 将注释 (Comment) 实现为元素 (Element),因此在 IE 中调用 getElementsByTagName("*") 将会返回所有注释节点。
虽然标准规定标签名需要区分大小写,但为了最大限度地与既有HTML页面兼容,传给 getElementsByTagName() 的标签名是不需要区分大小写的。但对于 XML 页面而言 (包括 XHTML),getElementsByTagName() 方法就会区分大小写。
(3)第三个方法,也是只有 HTMLDocument 类型才有的方法,是 getElementsByName()。顾名思义,这个方法会返回带有给定 name 特性的所有元素。最常使用 getElementsByName() 方法的情况是取得单选按钮;为了确保发送给浏览器的值正确无误,所有单选按钮必须具有相同的 name 特性,如下面的例子所示:
如这个例子所示,其中所有单选按钮的 name 特性值都是 "color",但它们的ID可以不同。ID的作用在于将 <label> 元素应用到每个单选按钮,而 name 特性则用以确保三个值中只有一个被发送给浏览器。这样,我们就可以使用如下代码取得所有单选按钮:
var radios = document.getElementsByName("color");
与 getElementsByTagName() 类似,getElementsByName() 方法也会返回一个 HTMLCollection 。但是,对于这里的单选按钮来说,namedItem() 方法则只会取得第一项 (因为每一项的 name 特性都相同)。
4.特殊集合
除了属性和方法,document 对象还有一些特殊的集合。这些集合都是 HTMLCollection 对象,为访问文档常用的部分提供了快捷方式,包括:
这个特殊集合始终都可以通过 HTMLDocument 对象访问到,而且,与 HTMLCollection 对象类似,集合中的项也会随着当前文档内容的更新而更新。
5.DOM一致性检测
由于 DOM 分为多个级别,也包含多个部分,因此检测浏览器实现了 DOM 的哪些部分就十分必要了。document.implementation 属性就是为此提供相应信息和功能的对象,与浏览器对 DOM 的实现直接对应。DOM1 级只为 document.implementation 规定了一个方法,即 hasFeature()。这个方法接受两个参数:要检测的 DOM 功能的名称及版本号。如果浏览器支持给定名称和版本的功能,则该方法返回 true ,如下面的例子所示:
var hasXmlDom = document.implementation.hasFeature("XML", "1.0");
下表列出了可以检测的不同的值及版本号。
尽管使用 hasFeature() 确实方便,但也有缺点。因为实现者可以自行决定是否与 DOM 规范的不同部分保持一致。事实上,要想让 hasFeature() 方法针对所有值都返回 true 很容易,但返回 true 有时候也不意味着实现与规范一致。例如,Safari 2.x 及更早版本会在没有完全实现某些 DOM 功能的情况下也返回 true 。为此,我们建议多数情况下,在使用 DOM 的某些特殊的功能之前,最好除了检测 hasFeature() 之外,还同时使用能力检测。
6.文档写入
有一个 document 对象的功能已经存在很多年了,那就是将输出流写入到网页中的能力。这个能力体现在下列4个方法中: write()、writeln()、open() 和 close() 。其中,write() 和 writeln() 方法都接受一个字符串参数,即要写入到输出流中的文本。write() 会原样写入,而 writeln() 则会在字符串的末尾添加一个换行符 (\n)。在页面被加载的过程中,可以使用这两个方法向页面中动态地加入内容,如下面的例子所示:
这个例子展示了在页面加载过程中输出当前日期和时间的代码。其中,日期被包含在一个 <strong> 元素中,就像在 HTML 页面中包含普通的文本一样。这样做会创建一个 DOM 元素,而且可以在将来访问该元素。通过 write() 和 writeln() 输出的任何 HTML 代码都将如此处理。
此外,还可以使用 write() 和 writeln() 方法动态地包含外部资源,例如 JavaScript 文件等。在包含 JavaScript 文件时,必须注意不能像下面的例子那样直接包含字符串 "</script>" 因为这回导致该字符串被解释为脚本块的结束,因此它后面的代码将不能执行。
即使这个文件看起来没错,但字符串 "</script>" 将被解释为与外部的 <script> 标签匹配,结果文本 ") ; 将会出现在页面中。为避免这个问题,只须把这个字符串分开写即可;第2章也曾经提及这个问题,解决方案如下:
在把字符串 "</script>" 分成拼接字符串 "</scr" + "ipt>" 之后,它就不会被当作外部 <script> 标签的关闭标签了,因而页面中也就不会出现多余的内容了。
前面的例子使用 document.write() 在页面被呈现的过程中直接向其中输出了内容。如果在文档加载结束后再调用 document.write(),那么输出的内容将会重写整个页面,如下面的例子所示:
在这个例子中,我们使用了 window.onload 事件处理程序,等到页面完全加载之后延迟执行函数。函数执行之后,字符串 "Hello world!" 会重写整个页面内容。
方法 open() 和 close() 分别用于打开和关闭网页的输出流。如果是在页面加载期间使用 write() 或 writeln() 方法,则不需要用到这两个方法。
严格型XHTML文档不支持文档写入。对于那些按照 application/xml+xhtml 内容类型提供的页面,这两个方法也同样无效。