JavaScript高级程序设计之DOM之节点层次之Document类型第10.1.2讲

JavaScript 通过Document 类型表示文档。在浏览器中,document 对象是HTMLDocument(继承
自Document 类型)的一个实例,表示整个HTML 页面。而且,document 对象是window 对象的一个
属性,因此可以将其作为全局对象来访问。Document 节点具有下列特征:
nodeType 的值为9;
nodeName 的值为"#document";
nodeValue 的值为null;
parentNode 的值为null;
ownerDocument 的值为null;
其子节点可能是一个DocumentType(最多一个)、Element(最多一个)、ProcessingInstruction
或Comment。
Document 类型可以表示HTML 页面或者其他基于XML 的文档。不过,最常见的应用还是作为
HTMLDocument 实例的document 对象。通过这个文档对象,不仅可以取得与页面有关的信息,而且还
能操作页面的外观及其底层结构。
在Firefox、Safari、Chrome 和Opera 中,可以通过脚本访问Document 类型的构
造函数和原型。但在所有浏览器中都可以访问HTMLDocument 类型的构造函数和原型,
包括IE8 及后续版本。

1.
文档的子节点
虽然DOM 标准规定Document 节点的子节点可以是DocumentType、Element、ProcessingIn-
struction 或Comment,但还有两个内置的访问其子节点的快捷方式。第一个就是documentElement
属性,该属性始终指向HTML 页面中的<html>元素。另一个就是通过childNodes 列表访问文档元素,
但通过documentElement 属性则能更快捷、更直接地访问该元素。以下面这个简单的页面为例。

<html>
<body>
</body>
</html>
这个页面在经过浏览器解析后,其文档中只包含一个子节点,即<html>元素。可以通过
documentElement 或childNodes 列表来访问这个元素,如下所示。

var html = document.documentElement; //取得对<html>的引用
alert(html === document.childNodes[0]); //true
alert(html === document.firstChild); //true
这个例子说明,documentElement、firstChild 和childNodes[0]的值相同,都指向<html>
元素。
作为HTMLDocument 的实例,document 对象还有一个body 属性,直接指向<body>元素。因为开
发人员经常要使用这个元素,所以document.body 在JavaScript 代码中出现的频率非常高,其用法如下。
var body = document.body; //取得对<body>的引用
所有浏览器都支持document.documentElement 和document.body 属性。
Document 另一个可能的子节点是DocumentType。通常将<!DOCTYPE>标签看成一个与文档其他
部分不同的实体,可以通过doctype 属性(在浏览器中是document.doctype)来访问它的信息。
var doctype = document.doctype; //取得对<!DOCTYPE>的引用
浏览器对document.doctype 的支持差别很大,可以给出如下总结。
IE8 及之前版本:如果存在文档类型声明,会将其错误地解释为一个注释并把它当作Comment
节点;而document.doctype 的值始终为null。
IE9+及Firefox:如果存在文档类型声明,则将其作为文档的第一个子节点;document.doctype
是一个DocumentType 节点,也可以通过document.firstChild 或document.childNodes[0]
访问同一个节点。
Safari、Chrome 和Opera:如果存在文档类型声明,则将其解析,但不作为文档的子节点。docu-
ment.doctype 是一个DocumentType 节点,但该节点不会出现在document.childNodes 中。
由于浏览器对document.doctype 的支持不一致,因此这个属性的用处很有限。
从技术上说,出现在<html>元素外部的注释应该算是文档的子节点。然而,不同的浏览器在是否
解析这些注释以及能否正确处理它们等方面,也存在很大差异。以下面简单的HTML 页面为例。
<!--第一条注释-->
<html>
<body>
</body>
</html>
<!--第二条注释-->
看起来这个页面应该有3 个子节点:注释、<html>元素、注释。从逻辑上讲,我们会认为
document.childNodes 中应该包含与这3 个节点对应的3 项。但是,现实中的浏览器在处理位于
<html>外部的注释方面存在如下差异。
IE8 及之前版本、Safari 3.1 及更高版本、Opera 和Chrome 只为第一条注释创建节点,不为第二
条注释创建节点。结果,第一条注释就会成为document.childNodes 中的第一个子节点。
IE9 及更高版本会将第一条注释创建为document.childNodes 中的一个注释节点,也会将第
二条注释创建为document.childNodes 中的注释子节点。
Firefox 以及Safari 3.1 之前的版本会完全忽略这两条注释。
同样,浏览器间的这种不一致性也导致了位于<html>元素外部的注释没有什么用处。
多数情况下,我们都用不着在document 对象上调用appendChild()、removeChild()和
replaceChild()方法,因为文档类型(如果存在的话)是只读的,而且它只能有一个元素子节点(该
节点通常早就已经存在了)。
2.
文档信息
作为HTMLDocument 的一个实例,document 对象还有一些标准的Document 对象所没有的属性。
这些属性提供了document 对象所表现的网页的一些信息。其中第一个属性就是title,包含着
<title>元素中的文本——显示在浏览器窗口的标题栏或标签页上。通过这个属性可以取得当前页面的
标题,也可以修改当前页面的标题并反映在浏览器的标题栏中。修改title 属性的值不会改变<title>
元素。来看下面的例子。
//取得文档标题
var originalTitle = document.title;
//设置文档标题
document.title = "New page title";
接下来要介绍的3 个属性都与对网页的请求有关,它们是URL、domain 和referrer。URL 属性
中包含页面完整的URL(即地址栏中显示的URL),domain 属性中只包含页面的域名,而referrer
属性中则保存着链接到当前页面的那个页面的URL。在没有来源页面的情况下,referrer 属性中可能
会包含空字符串。所有这些信息都存在于请求的HTTP 头部,只不过是通过这些属性让我们能够在
JavaScrip 中访问它们而已,如下面的例子所示。

//取得完整的URL
var url = document.URL;
//取得域名
var domain = document.domain;
//取得来源页面的URL
var referrer = document.referrer;
URL 与domain 属性是相互关联的。例如,如果document.URL 等于http://www.wrox.com/WileyCDA/,
那么document.domain 就等于www.wrox.com。
在这3 个属性中,只有domain 是可以设置的。但由于安全方面的限制,也并非可以给domain 设
置任何值。如果URL 中包含一个子域名,例如p2p.wrox.com,那么就只能将domain 设置为"wrox.com"
(URL 中包含"www",如www.wrox.com 时,也是如此)。不能将这个属性设置为URL 中不包含的域,
如下面的例子所示。
//假设页面来自p2p.wrox.com 域
document.domain = "wrox.com"; // 成功
document.domain = "nczonline.net"; // 出错!
当页面中包含来自其他子域的框架或内嵌框架时,能够设置document.domain 就非常方便了。由
于跨域安全限制,来自不同子域的页面无法通过JavaScript 通信。而通过将每个页面的
document.domain 设置为相同的值,这些页面就可以互相访问对方包含的JavaScript 对象了。例如,
假设有一个页面加载自www.wrox.com,其中包含一个内嵌框架,框架内的页面加载自p2p.wrox.com。
由于document.domain 字符串不一样,内外两个页面之间无法相互访问对方的JavaScript 对象。但如
果将这两个页面的document.domain 值都设置为"wrox.com",它们之间就可以通信了。
浏览器对domain 属性还有一个限制,即如果域名一开始是“松散的”(loose),那么不能将它再设
置为“紧绷的”(tight)。换句话说,在将document.domain 设置为"wrox.com"之后,就不能再将其
设置回"p2p.wrox.com",否则将会导致错误,如下面的例子所示。
//假设页面来自于p2p.wrox.com 域
document.domain = "wrox.com"; //松散的(成功)
document.domain = "p2p.wrox.com"; //紧绷的(出错!)
所有浏览器中都存在这个限制,但IE8 是实现这一限制的最早的IE 版本。
3.
查找元素
说到最常见的DOM 应用,恐怕就要数取得特定的某个或某组元素的引用,然后再执行一些操作了。
取得元素的操作可以使用document 对象的几个方法来完成。其中,Document 类型为此提供了两个方
法:getElementById()和getElementsByTagName()。
第一个方法,getElementById(),接收一个参数:要取得的元素的ID。如果找到相应的元素则
返回该元素,如果不存在带有相应ID 的元素,则返回null。注意,这里的ID 必须与页面中元素的id
特性(attribute)严格匹配,包括大小写。以下面的元素为例。
<div id="myDiv">Some text</div>
可以使用下面的代码取得这个元素:
var div = document.getElementById("myDiv"); //取得<div>元素的引用
但是,下面的代码在除IE7 及更早版本之外的所有浏览器中都将返回null。
var div = document.getElementById("mydiv"); //无效的ID(在IE7 及更早版本中可以)
IE8 及较低版本不区分ID 的大小写,因此"myDiv"和"mydiv"会被当作相同的元素ID。
如果页面中多个元素的ID 值相同,getElementById()只返回文档中第一次出现的元素。IE7 及较
低版本还为此方法添加了一个有意思的“怪癖”:name 特性与给定ID 匹配的表单元素(<input>、
<textarea>、<button>及<select>)也会被该方法返回。如果有哪个表单元素的name 特性等于指
定的ID,而且该元素在文档中位于带有给定ID 的元素前面,那么IE 就会返回那个表单元素。来看下面
的例子。
<input type="text" name="myElement" value="Text field">
<div id="myElement">A div</div>
基于这段HTML 代码,在IE7 中调用document.getElementById("myElement "),结果会返
回<input>元素;而在其他所有浏览器中,都会返回对<div>元素的引用。为了避免IE 中存在的这个问
题,最好的办法是不让表单字段的name 特性与其他元素的ID 相同。
另一个常用于取得元素引用的方法是getElementsByTagName()。这个方法接受一个参数,即要
取得元素的标签名,而返回的是包含零或多个元素的NodeList。在HTML 文档中,这个方法会返回一
个HTMLCollection 对象,作为一个“动态”集合,该对象与NodeList 非常类似。例如,下列代码
会取得页面中所有的<img>元素,并返回一个HTMLCollection。
var images = document.getElementsByTagName("img");
这行代码会将一个HTMLCollection 对象保存在images 变量中。与NodeList 对象类似,可以
使用方括号语法或item()方法来访问HTMLCollection 对象中的项。而这个对象中元素的数量则可以
通过其length 属性取得,如下面的例子所示。

alert(images.length); //输出图像的数量
alert(images[0].src); //输出第一个图像元素的src 特性
alert(images.item(0).src); // 输出第一个图像元素的src 特性

HTMLCollection 对象还有一个方法,叫做namedItem(),使用这个方法可以通过元素的name
特性取得集合中的项。例如,假设上面提到的页面中包含如下<img>元素:
<img src="myimage.gif" name="myImage">
那么就可以通过如下方式从images 变量中取得这个<img>元素:
var myImage = images.namedItem("myImage");
在提供按索引访问项的基础上,HTMLCollection 还支持按名称访问项,这就为我们取得实际想要
的元素提供了便利。而且,对命名的项也可以使用方括号语法来访问,如下所示:
var myImage = images["myImage"];
对HTMLCollection 而言,我们可以向方括号中传入数值或字符串形式的索引值。在后台,对数
值索引就会调用item(),而对字符串索引就会调用namedItem()。
要想取得文档中的所有元素,可以向getElementsByTagName()中传入"*"。在JavaScript 及CSS
中,星号(*)通常表示“全部”。下面看一个例子。
var allElements = document.getElementsByTagName("*");
仅此一行代码返回的HTMLCollection 中,就包含了整个页面中的所有元素——按照它们出现的
先后顺序。换句话说,第一项是<html>元素,第二项是<head>元素,以此类推。由于IE 将注释(Comment)
实现为元素(Element),因此在IE 中调用getElementsByTagName("*")将会返回所有注释节点。
虽然标准规定标签名需要区分大小写,但为了最大限度地与既有HTML 页面兼
容,传给getElementsByTagName()的标签名是不需要区分大小写的。但对于XML
页面而言(包括XHTML),getElementsByTagName()方法就会区分大小写。
第三个方法,也是只有HTMLDocument 类型才有的方法,是getElementsByName()。顾名思义,
这个方法会返回带有给定name 特性的所有元素。最常使用getElementsByName()方法的情况是取得
单选按钮;为了确保发送给浏览器的值正确无误,所有单选按钮必须具有相同的name 特性,如下面的
例子所示。
<fieldset>
<legend>Which color do you prefer?</legend>
<ul>
<li><input type="radio" value="red" name="color" id="colorRed">
<label for="colorRed">Red</label></li>
<li><input type="radio" value="green" name="color" id="colorGreen">
<label for="colorGreen">Green</label></li>
<li><input type="radio" value="blue" name="color" id="colorBlue">
<label for="colorBlue">Blue</label></li>
</ul>
</fieldset>
如这个例子所示,其中所有单选按钮的name 特性值都是"color",但它们的ID 可以不同。ID 的
作用在于将<label>元素应用到每个单选按钮,而name 特性则用以确保三个值中只有一个被发送给浏
览器。这样,我们就可以使用如下代码取得所有单选按钮:
var radios = document.getElementsByName("color");
与getElementsByTagName()类似,getElementsByName()方法也会返回一个HTMLCollectioin。
但是,对于这里的单选按钮来说,namedItem()方法则只会取得第一项(因为每一项的name 特性都相同)。
4.
特殊集合
除了属性和方法,document 对象还有一些特殊的集合。这些集合都是HTMLCollection 对象,
为访问文档常用的部分提供了快捷方式,包括:
document.anchors,包含文档中所有带name 特性的<a>元素;
document.applets,包含文档中所有的<applet>元素,因为不再推荐使用<applet>元素,
所以这个集合已经不建议使用了;
document.forms,包含文档中所有的<form>元素,与document.getElementsByTagName("form")
得到的结果相同;
document.images,包含文档中所有的<img>元素,与document.getElementsByTagName
("img")得到的结果相同;
document.links,包含文档中所有带href 特性的<a>元素。
这个特殊集合始终都可以通过HTMLDocument 对象访问到,而且,与HTMLCollection 对象类似,
集合中的项也会随着当前文档内容的更新而更新。

5. DOM
一致性检测
由于DOM 分为多个级别,也包含多个部分,因此检测浏览器实现了DOM 的哪些部分就十分必要
了。document.implementation 属性就是为此提供相应信息和功能的对象,与浏览器对DOM 的实现
直接对应。DOM1 级只为document.implementation 规定了一个方法,即hasFeature()。这个方
法接受两个参数:要检测的DOM 功能的名称及版本号。如果浏览器支持给定名称和版本的功能,则该
方法返回true,如下面的例子所示:

var hasXmlDom = document.implementation.hasFeature("XML", "1.0");



尽管使用hasFeature()确实方便,但也有缺点。因为实现者可以自行决定是否与DOM 规范的不
同部分保持一致。事实上,要想让hasFearture()方法针对所有值都返回true 很容易,但返回true
有时候也不意味着实现与规范一致。例如,Safari 2.x 及更早版本会在没有完全实现某些DOM 功能的情
况下也返回true。为此,我们建议多数情况下,在使用DOM 的某些特殊的功能之前,最好除了检测
hasFeature()之外,还同时使用能力检测。

6.
文档写入
有一个document 对象的功能已经存在很多年了,那就是将输出流写入到网页中的能力。这个能力
体现在下列4 个方法中:write()、writeln()、open()和close()。其中,write()和writeln()
方法都接受一个字符串参数,即要写入到输出流中的文本。write()会原样写入,而writeln()则会
在字符串的末尾添加一个换行符(\n)。在页面被加载的过程中,可以使用这两个方法向页面中动态地
加入内容,如下面的例子所示。

<html>
<head>
<title>document.write() Example</title>
</head>
<body>
<p>The current date and time is:
<script type="text/javascript">
document.write("<strong>" + (new Date()).toString() + "</strong>");
</script>
</p>
</body>
</html>

这个例子展示了在页面加载过程中输出当前日期和时间的代码。其中,日期被包含在一个<strong>
元素中,就像在HTML 页面中包含普通的文本一样。这样做会创建一个DOM 元素,而且可以在将来访
问该元素。通过write()和writeln()输出的任何HTML 代码都将如此处理。
此外,还可以使用write()和writeln()方法动态地包含外部资源,例如JavaScript 文件等。在包
含JavaScript 文件时,必须注意不能像下面的例子那样直接包含字符串"</script>",因为这会导致该
字符串被解释为脚本块的结束,它后面的代码将无法执行。

<html>
<head>
<title>document.write() Example 2</title>
</head>
<body>
<script type="text/javascript">
document.write("<script type=\"text/javascript\" src=\"file.js\">" +
"</script>");
</script>
</body>
</html>

即使这个文件看起来没错,但字符串"</script>"将被解释为与外部的<script>标签匹配,结果
文本");将会出现在页面中。为避免这个问题,只需加入转义字符\即可;第2 章也曾经提及这个问题,
解决方案如下。

<html>
<head>
<title>document.write() Example 3</title>
</head>
<body>
<script type="text/javascript">
document.write("<script type=\"text/javascript\" src=\"file.js\">" +
"<\/script>");
</script>
</body>
</html>

字符串"<\/script>"不会被当作外部<script>标签的关闭标签,因而页面中也就不会出现多余
的内容了。
前面的例子使用document.write()在页面被呈现的过程中直接向其中输出了内容。如果在文档
加载结束后再调用document.write(),那么输出的内容将会重写整个页面,如下面的例子所示:

<html>
<head>
<title>document.write() Example 4</title>
</head>
<body>
<p>This is some content that you won't get to see because it will be overwritten.</p>
<script type="text/javascript">
window.onload = function(){
document.write("Hello world!");
};
</script>
</body>
</html>
在这个例子中,我们使用了window.onload 事件处理程序(事件将在第13 章讨论),等到页面完
全加载之后延迟执行函数。函数执行之后,字符串"Hello world!"会重写整个页面内容。
方法open()和close()分别用于打开和关闭网页的输出流。如果是在页面加载期间使用write()
或writeln()方法,则不需要用到这两个方法。
严格型XHTML 文档不支持文档写入。对于那些按照application/xml+xhtml
内容类型提供的页面,这两个方法也同样无效。


















 











  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值