HTML5标签规定
HTML5的
拖动和下降7.6 - 表的内容 - 8.2解析HTML文件
8 HTML语法
8.1编写的HTML文件
8.1.1了DOCTYPE
8.1.2元素
开始标记
结束标记
属性
可选的标签
上的内容模型的限制
对原始文本和RCDATA元素的内容的限制
8.1.3文本
换行
8.1.4字符引用
8.1.5 CDATA区段
8.1.6评论
8 HTML语法
本节只介绍了带有标记的资源规则html MIME类型 。XML资源的规则,讨论了一节题为“下面的XHTML语法“ 。
8.1编写的HTML文件
本节仅适用于文件,创作工具和标记发电机。特别是,它并不适用于一致性检查器;一致性检查器必须使用在下一节(“解析HTML文件”)的要求。
文件必须包括以下几部分组成,在给定的顺序:
或者,一个单U + FEFF字节顺序标记(BOM)字符。
任意数量的注释和 空格字符。
一个DOCTYPE。
任意数量的注释和 空格字符。
根元素的HTML 元素中的一个形式。
任意数量的注释和 空格字符。
上面提到的各类内容,在接下来的几节描述。
此外,还有一些是关于如何限制字符编码声明要序列化的,在这一议题上的一节讨论。
前根的空间字符的HTML元素,并且在开始的空格字符 的HTML元素,head元素前,将被删除的文档被解析时空格 字符后根HTML元素将被解析,如果他们在结束身体元素。因此,周围的根元素中的空格字符不往返。
它是建议的DOCTYPE后,换行符插入任何意见在根元素之前后之后, HTML元素的开始标记(如果它是不能省略),和之后的任何评论,里面是的HTML元素,但前 head元素。
HTML语法中的许多字符串(如元素及其属性的名称)是大小写不敏感,但仅适用于范围U +0041至U +005(拉丁大写字母A到拉丁大写字母Z)字符和ü 0061到U +007一个(拉丁小函件一个拉丁小字母Z)。为方便起见,在本节中,这是刚才提到的为“不区分大小写”。
8.1.1了DOCTYPE
一个DOCTYPE是必需的序言。
文档类型所需遗留原因。省略时,浏览器往往使用不同的渲染模式,是不符合一些规范。包括文档中的DOCTYPE确保浏览器在以下相关规范尽力尝试。
一个DOCTYPE必须由以下几部分组成组成,顺序如下:
这是一个ASCII的大小写不敏感的字符串匹配一个字符串“
一个或多个空格字符。
一个字符串,它是一个ASCII不区分大小写的匹配字符串“ HTML “。
或者,一个DOCTYPE传统的字符串或一个过时的DOCTYPE允许字符串(定义见下文) 。
零个或多个空格字符。
一个U 003发送更大的比符号(>)。
换句话说, ,不区分大小写。
就不能输出与短期的DOCTYPE HTML标记的HTML发电机的目的““, 一个DOCTYPE传统的字符串可能会被插入到的DOCTYPE(在上面定义的位置 )。此字符串必须包括:
一个或多个空格字符。
一个字符串,它是一个ASCII不区分大小写的匹配字符串“ 系统 “。
一个或多个空格字符。
一个U 0022引号或ü 0027撇号字符(引号)。
字符串“ :传统的COMPAT “。
一个匹配ü 0022引号或U 0027撇号字符(即在前面步骤中标记相同的字符引号)。
换句话说,或不区分大小写,除了在单引号或双引号的一部分。
DOCTYPE遗留字符串不应该使用,除非该文件是从一个系统,可以不输出较短的字符串生成。
为了帮助作者从HTML4和XHTML1的过渡,一个过时的 允许的DOCTYPE字符串,可插入的DOCTYPE(在上面定义的位置) 。此字符串必须包括:
一个或多个空格字符。
一个字符串,它是一个ASCII不区分大小写的匹配字符串“ 公共 “。
一个或多个空格字符。
一个U 0022引号或ü 0027撇号字符(引号)。
从下表的第一列的单元格之一字符串。该单元所属行选定的行。
一个匹配ü 0022引号或U 0027撇号字符(即相同的字符在前面的步骤中标记的第一个引号) 。
如果选定行中的第二列的单元格不为空,一个或多个空格字符。
如果在第二列的单元格选定的行不是空白的,一个U 0022引号或U 0027撇号字符(第三引号 )。
如果选定行中的第二列的单元格不为空,在第二列的单元格选定行的字符串。
如果选定行中的第二列的单元格不为空,匹配ü 0022引号或U 0027撇号字符(即在前面的步骤中标记相同的字符第三引号