HTML 5标准学习入门之DOCTYPE

转载 2011年10月15日 09:59:51
 

上一篇文章主要讲述了HTML文档的构成,同时肤浅地接触了“标签省略”这一概念,本文会从概念上介绍HTML文档中第一个出现的重要元素 - DOCTYPE。

51CTO推荐专题:HTML 5 下一代Web开发标准详解

所谓DOCTYPE,最初是XML的概念,即通过一种特定的语法,作为一种元数据,来描述XML文档中允许出现的元素,以及各元素的组成、嵌套规则等。具体的概念可以在WIKI中中得到一个更详细的结果。

但是在HTML中,DOCTYPE又有着一些不同的效果,其中之一就是著名的触发浏览器标准模式的功能。即如果没有DOCTYPE,浏览器会进入一种被称为Quirks模式的怪异状态,在该模式下,浏览器的盒模型、样式解析、布局等都与标准规定的存在差异。

需要注意的是,所谓的HTML标准、DOM标准等,只规定了在标准模式下的概念和行为,正如文档构成中提到的,DOCTYPE是一个HTML文档绝对不可以省略的部分,因此就根本不存在“Quirks模式”这样的概念。也正是因为标准中没有对Quirks模式做出任何的规定,因此不同浏览器在Quirks模式下的处理也是不同的,应用Quirks模式可谓难上加难。

HTML4的DOCTYPE

在HTML4的标准中,DOCTYPE被归属于“HTML版本信息”一章中。在该章节中,标准指定了3种DOCTYPE:

•严格模式:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">。

•过渡模式:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">。

•框架模式:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">。

在HTML4的标准中,每一个DOCTYPE对应的dtd文件都是有合法的URL指定的,可以通过互联网进行下载。浏览器可以根据URL获得到dtd的具体内容,并根据内容的规定来解析文档。

现实是不同的

HTML4如同XML一样,是一个相当理想化的标准。但是,现实往往并没有这么理想,试想下面的HTML文档:

  1. <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN"   
  2. "http://www.w3.org/TR/html4/frameset.dtd"> 
  3. <html> 
  4. <head> 
  5. <title>I'm not a frameset</title> 
  6. </head> 
  7. <body> 
  8. <p>So what?</p> 
  9. </body> 
  10. </html> 

这个文档采用了一个框架模式的DOCTYPE,但其正文确没有使用任何<frame>元素,相对应地使用了应该由严格模式或者过渡模式指定的,标准的HTML结构。那么在这种情况下,浏览器能做什么呢?

拒绝渲染该页面?不,浏览器不敢这么做,在激烈的市场竞争之中,如果因此而导致部分页面无法渲染的话,就只能眼睁睁看着市场份额注入别家田了。所以浏览器顶多弱弱地报一个警告以示抗议,却依旧得乖乖地解析出这个文档并正确渲染。

这就是所谓的浏览器的“容错性”,事实上无论你的DOCTYPE是什么,浏览器都会以最大的兼容能力去解析一个文档,并以最大的努力让这个文档显示得符合开发者的预期。而浏览器的这一特性,也逐渐让标准制定者开始意识到,DOCTYPE似乎真的不怎么重要。因此,在HTML5中,DOCTYPE发生了一次重大的变化……

HTML 5的DOCTYPE

到了HTML 5了,这一变化相信多数人已经知道,就是HTML 5将DOCTYPE的声明简化了,只需要<!DOCTYPE html>即可。

正好前文所述,在HTML 4时代,标准制定者已经认识到,DOCTYPE对浏览器的渲染并没有太大的帮助,除了给无聊的w3c验证器看以外,DOCTYPE似乎只有触发浏览器兼容模式的作用。于是标准工作组采取了非常实际的态度,测试了所有课程顺触发标准模式的最简DOCTYPE,最终得出了这一结论。

但是故事不会这么简单,标准工作组也不是完成这么简单的动作就撒手不管的无赖分子,事实上他们还是很尽责任地考虑到了向后兼容性、可扩展性等一系列的事情,最后将DOCTYPE一章用了大量文字来进行描述,得到一个非常详实的结果。

HTML 5的参考手册相关章节中,将DOCTYPE分为3类:

普通DOCTYPE - normal doctype

普通DOCTYPE就是我们所见的最简形式,即<!DOCTYPE html>,他的真正组成是这样的:

•一段文本,即<!DOCTYPE,大小写不敏感。

•1个或多个空格,关于空格的定义请参照简介中的解释。

•字符HTML,同样大小写不敏感。

•1个或多个空格。

•结束标记,即>。

不再推荐的DOCTYPE - deprecated doctype

即所谓HTML 4时代的几个DOCTYPE,其组成如下:

•一段文本,即<!DOCTYPE,大小写不敏感。
 

•1个或多个空格。

•字符HTML,同样大小写不敏感。
 

•1个或多个空格。

•字符PUBLIC,大小写不敏感。

•继续1个或多个空格。

•一对引号或单引号(必须前后匹配),引号中放一个Public ID。

•可选内容:

•1个或多个空格。

•一对引号或单引号(必须前后匹配),引号中放一个与前面的Public ID对应的System ID。

•1个或多个空格。

•结束标记,即>。

在标准中,Public ID和System ID是有严格的对应关系的,如果规定的System ID不能有Public ID,则上面的第8项可选内容也就不能存在。HTML5彻底放弃了HTML4中的过渡型和框架型的DOCTYPE,同时整合了XHTML的DOCTYPE声明,得出以下6种组合方式:

•<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN">

•<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN" "http://www.w3.org/TR/REC-html40/strict.dtd">

•<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN">

•<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">

•<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

•<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">

遗留工具DOCTYPE - leagacy tool compatible doctype

顾名思义,完全是为了兼容久远时代的历史遗产而准备的DOCTYPE,甚至都已经没办法考证什么样的“工具”会搞出这种DOCTYPE来……遗留工具型的DOCTYPE的组成如下:

•一段文本,即<!DOCTYPE,大小写不敏感。

•1个或多个空格。

•字符HTML,同样大小写不敏感。

•1个或多个空格。

•字符SYSTEM,大小写不敏感。

•继续1个或多个空格。

•一对引号或单引号(必须前后匹配),引号中放一段文本about:legacy-compat,注意这段文本是大小写敏感的。

•1个或多个空格。

•结束标记,即>。

比如这样的DOCTYPE就属于此类:<!doctype HTML system "about:legacy-compat">,基本上除了大小写,没有什么值得改变的。

现实的细节

对于DOCTYPE的作用,在真正的浏览中,仅仅起到触发浏览器的标准模式的作用。虽然根据标准,一个HTML文档中,DOCTYPE前可以有其他的元素,如一个U+FFEF的BOM,几个注释,一点空格,但是在当前的状态下,并没有这么理想:

•对于IE6-9,如果DOCTYPE前存在注释,会进入Quirks模式。

•对于IE6,如果DOCTYPE前存在一个XML声明,会进入Quirks模式。

写完才发现,问题又全出在IE下……关于DOCTYPE的问题纠结至此。

HTML 5全掌控

-
  • 1970年01月01日 08:00

HTML5的第一行<!DOCTYPE HTML>

新浪微博:紫松哥哥 您的浏览、关注、评论是我最大的进步! 定义和用法 声明必须在HTML5文档的第一件事,在标记之前。 doctype声明不是HTML标签,它是一个指令到web浏览器...
  • zisongjia
  • zisongjia
  • 2016-09-25 11:18:21
  • 1034

doctype 怪异模式和标准模式

1、Doctype? Doctype是一种标准通用的文档类型声明,它必须出现在文件的第一行,目的是告诉浏览器使用什么样的文档类型定义(DTD)来解析文档。 它不是HTML标签,它是指示we...
  • shadow_yn
  • shadow_yn
  • 2015-06-15 22:07:53
  • 1292

HTML5中回归简单的<!DOCTYPE>声明

默认情况下,Firefox浏览器和IE浏览器的解释标准是不一样的。如果一个网页没有声明DOCTYPE,它就会以默认的DOCTYPE解释下面的HTML或XHTML。在同一种标准下,不同浏览器的解释模型都...
  • wangxiaoqin11
  • wangxiaoqin11
  • 2014-12-19 21:22:43
  • 1807

为页面添加正确的doctype声明-W3C标准

用dw设计网页时,代码最前面总要出现一个下面的东东, "http://www.w3.org/tr/html4/loose.dtd"> 这个是dw自动在网页文件页增加了dtd信息(DOCTYPE...
  • qq592304796
  • qq592304796
  • 2016-08-16 16:57:55
  • 297

DOCTYPE声明——标准模式与怪异模式的区别

DOCTYPE声明:告知浏览器如何解析和渲染文档 DTD:文档类型定义 分类方式一1、标准模式:浏览器按W3C标准解析执行代码 ① 如果XHTML文档包含完整的DOCTYPE,那么它一...
  • Vivian_jay
  • Vivian_jay
  • 2017-03-13 22:24:32
  • 1650

Doctype作用?DTD是啥?标准模式与兼容模式各有什么区别-

1. Doctype定义这个标签是一种通用标记语言的文档类型声明,它主要就是告诉标准通用标记语言解析器应该使用什么样的文档类型定义 Document Type Definition(DTD)来解析文档...
  • taoge1024
  • taoge1024
  • 2017-04-13 21:02:46
  • 1091

最近的学习内容

最近学习的主要有 :          1.C3动画、H5          2.预习了一下Js                         1.C3 动画部分,主要做了两个网页,一个是...
  • Meeeky
  • Meeeky
  • 2017-01-19 16:34:20
  • 187

Doctype作用,标准模式与兼容模式的区别

声明位于位于HTML文档中的第一行,处于 标签之前。告知浏览器的解析器用什么文档标准解析这个文档。DOCTYPE不存在或格式不正确会导致文档以兼容模式呈现。   标准模式的排版 和JS运作模式...
  • yan170772286
  • yan170772286
  • 2017-07-11 15:54:57
  • 433

HTML之DocType的几种类型

http://blog.sina.com.cn/s/blog_678c910c0100vgox.html 在默认情况下,FF和IE的解释标准是不一样的,也就是说,如果一个网页没有声明DOCTYP...
  • u011220611
  • u011220611
  • 2017-01-09 21:28:06
  • 517
收藏助手
不良信息举报
您举报文章:HTML 5标准学习入门之DOCTYPE
举报原因:
原因补充:

(最多只允许输入30个字)