浏览器工作原理详解

最新推荐文章于 2024-08-13 14:23:27 发布

黑面狐 sa~

最新推荐文章于 2024-08-13 14:23:27 发布

阅读量221

点赞数 1

分类专栏：前端

前端专栏收录该内容

60 篇文章 0 订阅

订阅专栏

原文：http://blog.csdn.net/dangnian/article/details/50876241

这篇文章是以色列开发人员塔利·加希尔的研究成果。她在查阅了所有公开发布的关于浏览器内部机制的数据，并花了很多时间来研读网络浏览器的源代码。她写道：

在 IE 占据 90%市场份额的年代，我们除了把浏览器当成一个“黑箱”，什么也做不了。但是现在，开放源代码的浏览器拥有了过半的市场份额，因此，是时候来揭开神秘的面纱，一探网络浏览器的内幕了。呃，里面只有数以百万行计的C++ 代码…

　　本篇文章的英文原版：How Browsers Work: Behind the Scenes of Modern Web Browsers。
　　本文主要参考和更新自下面两篇译文：
　　1)前端必读：浏览器内部工作原理
　　2)前端文摘：深入解析浏览器的幕后工作原理

作为一名网络开发人员，学习浏览器的内部工作原理将有助于您作出更明智的决策，并理解那些最佳开发实践的个中缘由。尽管这是一篇相当长的文档，但是我们建议您花些时间来仔细阅读；读完之后，您肯定会觉得所费不虚。
保罗·爱丽诗(Paul Irish)，Chrome 浏览器开发人员事务部

第一章简介
　　浏览器是使用最广的软件之一。在这篇博文中，我将介绍浏览器的幕后工作原理。通过阅读本文，我们将会了解，从您在地址栏输入 google.com ，直到您在浏览器屏幕上看到 Google 首页的整个过程中都发生了些什么。

1.1 讨论的浏览器
　　目前使用的主流浏览器有五个：Internet Explorer、Firefox、Safari、Chrome和 Opera浏览器。本文主要以开源浏览器为主进行分析，即 Firefox、Chrome和 Safari(部分开源)。根据 StatCounter 浏览器统计数据，目前(2016年 2 月)Firefox(14.67%)、Safari(9.46%)和 Chrome(55.33%) 浏览器的总市场占有率将近 80%(这个数字在2011年8月的时候，才将近60%)。由此可见，如今开源浏览器在浏览器市场中占据绝大多数的市场份额。

1.2 浏览器的主要功能
　　浏览器的主要功能就是向服务器发出请求，在浏览器窗口中展示您想要访问的网络资源。这里所说的资源一般是指 HTML 文档，也可以是 PDF、图片或其他的类型。资源的位置由用户使用 URI(统一资源标示符)指定。

　　浏览器解释并显示HTML文件的方式是在 HTML 和 CSS 规范中指定的。这些规范由网络标准化组织 W3C（万维网联盟）进行维护。多年以来，各浏览器都没有完全遵从这些规范，同时还在开发自己独有的扩展程序，这给网络开发人员带来了严重的兼容性问题。如今，大多数的浏览器都开始尽量遵从规范。

　　浏览器的用户界面有很多彼此相同的元素，其中包括：用来输入 URI 的地址栏；前进和后退按钮；书签设置选项；用于刷新和停止加载当前文档的刷新和停止按钮；用于返回主页的主页按钮。
　　奇怪的是，浏览器的用户界面并没有任何正式的规范，这是多年来的最佳实践自然发展以及彼此模仿的结果。HTML5 也没有定义浏览器必须具有的用户界面元素，但列出了一些通用的元素，例如地址栏、状态栏和工具栏等。当然，各浏览器也可以有自己独特的功能，比如 Firefox 的下载管理器。

1.3 浏览器的高层结构(High Level Structure)
　　浏览器的主要组件包括：

用户界面 - 包括地址栏、前进/后退按钮、书签菜单等。除了浏览器主窗口显示的你请求的页面外，其他显示的各个部分都属于用户界面。
浏览器引擎 - 在用户界面和渲染引擎之间传送指令。
渲染引擎 - 负责显示请求的内容。如果请求的内容是 HTML，它就负责解析 HTML 和 CSS 内容，并将解析后的内容显示在屏幕上。
网络 - 用于网络调用，比如 HTTP 请求。其接口与平台无关，并为所有平台提供底层实现。
用户界面后端 - 用于绘制基本的窗口小部件，比如组合框和窗口。其公开了与平台无关的通用接口，而在底层使用操作系统的用户界面方法。
JavaScript 解释器。用于解析和执行 JavaScript 代码，比如chrome的javascript解释器是V8。
数据存储。这是持久层。浏览器需要在硬盘上保存各种数据，例如 Cookie。新的 HTML 规范 (HTML5)定义了“网络数据库”，这是一个完整（但是轻便）的浏览器内数据库。

浏览器的主要组件

图1.1：浏览器的主要组件。
　　值得注意的是，不同于大多数浏览器，Chrome 浏览器为每个标签页(Tab)都分配了各自的渲染引擎实例，每个标签页都是一个独立的进程(即每个标签页面都在独立的“沙箱”内运行，在提高安全性的同时，一个标签页面的崩溃也不会导致其他标签页面被关闭)。
　　对于构成浏览器的这些组件，后面会逐一详细讨论。
　　

第二章渲染引擎(The rendering engine)
　　渲染引擎的职责就是渲染，即在浏览器窗口中显示所请求的内容。这是每一个浏览器的核心部分，所以渲染引擎也称为浏览器内核。

　　默认情况下，渲染引擎可显示 HTML 和 XML 文档及图片。通过插件（或浏览器扩展程序），还浏览器渲染引擎也可以显示其它类型的内容。例如，使用 PDF 查看器插件就能显示 PDF 文档。在本章中，我们将集中介绍其主要用途：显示应用了CSS的 HTML 内容和图片。

2.1 渲染引擎简介
　　本文所讨论的浏览器（Firefox、Chrome和Safari）是基于两种渲染引擎构建的。Firefox 使用的是 Gecko，这是 Mozilla 公司“自制”的渲染引擎。而 Safari 和 Chrome(28版本以前)浏览器使用的都是 Webkit。

2013年7月10日发布的Chrome 28 版本中，Chrome浏览器开始正式使用Blink内核。所以，Webkit已经成为了Chrome浏览器的前内核。

　　Webkit 是一种开放源代码渲染引擎，起初用于 Linux 平台，随后由 Apple 公司进行修改，从而支持苹果机和 Windows。有关详情，请参阅 webkit.org。

2.2 主流程(The main flow)
　　渲染引擎一开始会从网络层获取请求文档的内容，通常以8K分块的方式完成。
　　获取了文档内容之后，渲染引擎开始正式工作，其基本流程：

解析html以构建dom树 -> 构建render树 -> 布局render树 -> 绘制render树

图2.1：渲染引擎的基本流程。
　　渲染引擎解析HTML文档，并将文档中的标签转化为dom节点树，即”内容树”。同时，它也会解析外部CSS文件以及style标签中的样式数据。这些样式信息连同HTML中的”可见内容”一道，被用于构建另一棵树——”渲染树(Render树)”。

　　渲染树由一些带有视觉属性(如颜色、大小等)的矩形组成，这些矩形将按照正确的顺序显示在频幕上。

　　渲染树构建完毕之后，将会进入”布局”处理阶段，即为每一个节点分配一个屏幕坐标。再下一步就是绘制(painting)，即遍历render树，并使用UI后端层绘制每个节点。

值得注意的是，这个过程是逐步完成的，为了更好的用户体验，渲染引擎将会尽可能早的将内容呈现到屏幕上，并不会等到所有的html都解析完成之后再去构建和布局render树。它是解析完一部分内容就显示一部分内容，同时，可能还在通过网络下载其余内容。

主流程示例

Webkit 主流程
图2.2：Webkit 主流程
Mozilla 的 Gecko 渲染引擎主流程
图2.3：Mozilla 的 Gecko 渲染引擎主流程
　　从图2.2 和图2.3可以看出，虽然 Webkit 和 Gecko 使用的术语略有不同，但整体流程还是基本相同的。

Gecko将视觉格式化元素组成的树称为”框架树”(frame)。每个元素都是一个框架。Webkit使用的术语是”渲染树”(render)，它由”渲染对象”组成。
对于元素的放置，Webkit 使用的术语是”布局”(layout)，而 Gecko 称之为”重排”(reflow)。
Webkit称利用dom节点及样式信息去构建render树的过程为attachment，Gecko在html和dom树之间附加了一层，这层称为内容接收器，相当制造dom元素的工厂。
　　我们会逐一论述流程中的每一部分：
第三章解析与DOM树构建(Parsing and DOM tree construction)
3.1 解析(Parsing-general)
　　既然解析是渲染引擎中一个非常重要的过程，我们将稍微深入的研究它。首先明白什么叫做解析(parsing)。
解析一个文档就是指将这个文档翻译成一个可以让代码理解和使用的有意义的结构。得到的结构通常是一个代表了该文档结构的节点树，通常称之为解析树或语法树。

　　例如，解析“2＋3-1”这个表达式，可能返回这样一棵树。
　　
数学表达式树节点
图3.1：数学表达式树节点
1.文法(Grammars)
　　解析是以文档所遵循的语法规则(编写文档所用的语言或格式)为基础的。所有可以解析的格式都必须对应确定的语法(由词汇和语法规则构成)。这称为与上下文无关的文法。人类语言并不属于这样的语言，因此无法用常规的解析技术进行解析。

2.解析器-词法分析器(Parser－Lexer combination)
　　解析一般可分为两个子过程：语法分析和词法分析。
　　语法分析指对语言应用语法规则。
　　词法分析就是将输入分解为符号，符号是语言的词汇表——基本有效单元的集合。对于人类语言来说，它相当于我们字典中出现的所有单词。

　　解析工作一般由两个组件共同完成：
　　1)词法分析器（有时也称为标记生成器），负责将输入内容分解成一个个有效标记。词法分析器知道如何将无关的字符（比如空格和换行符）分离出来。；
　　2)解析器负责根据语言的语法规则分析文档的结构，从而构建解析树。

从源文档到解析树
图3.2：从源文档到解析树
　　解析是一个迭代的过程。通常，解析器会向词法分析器请求一个新标记，并尝试将其与某条语法规则进行匹配。如果发现了匹配规则，解析器会将一个对应于该标记的节点添加到解析树中，然后继续请求下一个标记。
　　如果没有规则与该标记匹配，解析器就会将标记存储到内部，并继续请求下一个标记，直至找到可与所有内部存储的标记匹配的规则。
　　如果没有规则(即没有找到相应的语法规则)，解析器就会引发一个异常。这意味着文档无效，包含语法错误。

3.转换(Translation)
　　很多时候，解析树还不是最终结果。解析通常是在转换过程中使用的，而转换是指将输入文档转换成另一种格式。编译就是一个例子。编译器可将源代码编译成机器代码，具体过程是首先将源代码解析成解析树，然后将解析树翻译成机器代码文档。

编译流程
图3.3：编译流程
4.解析示例(Parsing example)
　　在图3.1中，我们通过一个数学表达式建立了解析树。现在，让我们试着定义一个简单的数学语言，用来演示解析的过程。

　　词汇表：我们用的语言可包含整数、加号和减号。
　　语法规则：1)构成语言的语法单位是表达式、项和运算符。2)该语言可以包括多个表达式。3)一个表达式定义为两个项通过一个操作符连接。4)运算符可以是加号或减号。5)项可以是一个整数或一个表达式。
　　现在来分析一下”2＋3－1”这个输入。
　　匹配语法规则的第一个子串是2，而根据第5条语法规则，这是一个项。匹配语法规则的第二个子串是 2 + 3，而根据第 3 条规则（一个项接一个运算符，然后再接一个项），这是一个表达式。下一个匹配项已经到了输入的结束。2 + 3 - 1 是一个表达式，因为我们已经知道 2 + 3 是一个项，这样就符合“一个项接一个运算符，然后再接一个项”的规则。2 + +不与任何规则匹配，因此是无效的输入。

5.词汇和语法的正式定义
1)词汇通常用正则表达式表示。

　　例如，我们的示例语言可以定义如下：

INTEGER :0|[1-9][0-9]*
PLUS : +
MINUS: -
1
2
3
　　正如您所看到的，这里用正则表达式给出了整数的定义。

2)语法通常使用一种称为 BNF 的格式来定义。

我们的示例语言可以定义如下：

expression := term operation term
operation := PLUS | MINUS
term := INTEGER | expression
1
2
3
　　之前我们说过，如果语言的语法是与上下文无关的语法，就可以由常规解析器进行解析。

与上下文无关的语法的直观定义就是可以完全用BNF格式表达的语法。有关正式定义，请参阅关于与上下文无关的语法的维基百科文章。

6.解析器类型
　　有两种基本类型的解析器：自上而下解析器和自下而上解析器。直观地来说，自上而下的解析器从语法的高层结构出发，尝试从中找到匹配的结构。而自下而上的解析器从低层规则出发，将输入内容逐步转化为语法规则，直至满足高层规则。

　　让我们来看看这两种解析器会如何解析我们的示例：
　　自顶向下解析器从最高层规则开始——它先识别出”2+3”，将其视为一个表达式，然后识别出”2+3-1”为一个表达式(识别表达式的过程中匹配了其他规则，但起点是最高层规则)。

　　自下而上的解析器将扫描输入内容，找到匹配的规则后，将匹配的输入内容替换成规则。如此继续替换，直到输入内容的结尾。部分匹配的表达式保存在解析器的堆栈中。

堆栈(Stack) 输入(Input)
2+3-1
项 +3-1
项运算 3-1
表达式 -1
表达式运算符 1
表达式 -
这种自下而上的解析器称为移位归约解析器，因为输入在向右移位（设想有一个指针从输入内容的开头移动到结尾），并逐渐简化语法规则。

7.自动生成解析器(Generating parsers automatically)
　　解析器生成器这个工具可以自动生成解析器，只需要指定语言的文法———词汇表及语法规则，它就可以生成一个解析器。创建一个解析器需要对解析有深入的理解，而且手动的创建一个有较好性能的解析器并不容易，所以解析生成器很有用。
　　
　　Webkit使用两个知名的解析生成器——用于创建语法分析器的Flex及创建解析器的Bison（你可能接触过Lex和Yacc）。Flex的输入是一个包含了符号定义的正则表达式，Bison的输入是用BNF格式表示的语法规则。

3.2 HTML 解析器(HTML Parser)
　　HTML 解析器的任务是将 HTML 标记解析成解析树。

1.HTML 语法定义(The HTML grammar definition)
　　W3C组织制定规范定义了HTML的词汇表和语法。

2.非与上下文无关的语法(Not a context free grammar)
　　正如在解析简介中提到的，上下文无关文法的语法可以用类似BNF的格式来定义。
　　很遗憾，所有的常规解析器都不适用于 HTML（我并不是开玩笑，它们可以用于解析 CSS 和 JavaScript）。HTML 并不能用解析器所需的与上下文无关的语法来定义。
　　Html有一个正式的格式定义：DTD(Document Type Definition，文档类型定义)，但它并不是上下文无关的语法。

　　这初看起来很奇怪：HTML 和 XML 非常相似。有很多 XML 解析器可以使用。HTML 存在一个 XML 变体 (XHTML)，那么有什么大的区别呢？区别在于 HTML 的处理更为“宽容”，它允许您省略某些隐式添加的标记，有时还能省略一些起始或者结束标记等等。和 XML 严格的语法不同，HTML 整体来看是一种“软性”的语法。

　　显然，这种看上去细微的差别实际上却带来了巨大的影响。一方面，这是 HTML 如此流行的原因：它能包容您的错误，简化网络开发。另一方面，这使得它很难编写正式的语法。概括地说，HTML 无法很容易地通过常规解析器解析（因为它的语法不是与上下文无关的语法），也无法通过 XML 解析器来解析。

3.HTML DTD
　　HTML的定义采用了DTD格式。此格式适用于定义SGML族的语言。它包括所有允许使用的元素及其属性和层次结构的定义。如上文所述，HTML DTD无法构成与上下文无关的语法。
　　DTD存在一些变体。严格模式完全遵守HTML规范，而其他模式可支持以前的浏览器所使用的标记。这样做的目的是确保向下兼容一些早期版本的内容。最新的严格模式DTD可以在这里找到：www.w3.org/TR/html4/strict.dtd

4.DOM
　　解析器的输出(即”解析树”)是由DOM元素及属性节点组成的。DOM是文档对象模型(Document Object Model) 的缩写。它是HTML文档的对象表示，同时也是外部内容(例如 JavaScript)与HTML元素之间的接口。
　　解析树的根节点是”Document”对象。DOM与标记之间几乎是一一对应的关系。比如下面这段标记：

Hello World

1
2
3
4
5
6
7
8
　　可翻译成如下的 DOM 树：

示例标签对应的DOM树
图3.4：示例标记的 DOM 树

　　
　　和HTML一样，DOM也是由W3C组织制定的。请参见www.w3.org/DOM/DOMTR。这是关于文档操作的通用规范。其中一个特定模块描述针对HTML的元素。HTML的定义可以在这里找到：www.w3.org/TR/2003/REC-DOM-Level-2-HTML-20030109/idl-definitions.html。
　　这里所说的DOM节点树，指的是那些实现了DOM接口的元素组成的树。
1
2
5.解析算法(The parsing algorithm)
　　我们在之前章节已经说过，HTML无法用常规的自上而下或自下而上的解析器进行解析。原因在于：
　　语言本身的宽容特性；
　　浏览器对一些常见的非法html有容错机制；
　　解析过程需要不断地反复。源内容在解析过程中通常不会改变，但是在HTML中，脚本标记如果包含 “document.write”，就会添加额外的标记，这样解析过程实际上就更改了输入内容。
　　
　　由于不能使用常规的解析技术，浏览器为html定制了专属的解析器。
　　HTML5规范详细地描述了解析算法。此算法由两个阶段组成：符号化及构建树。

　　符号化是词法分析的过程，将输入内容解析成多个标记，HTML标记包括起始标记、结束标记、属性名称和属性值。标记生成器识别标记，传递给树构造器，然后读取下一个字符以识别下一个标记，如此反复直到输入的结束。

HTML 解析流程

图3.5：HTML 解析流程
6.符号识别算法(The tokenization algorithm)
　　该算法的输出结果是HTML标记。该算法使用状态机来表示。每一个状态接收来自输入信息流的一个或多个字符，并根据这些字符更新下一个状态。当前的标记化状态和树结构状态会影响进入下一状态的决定。这意味着，即使接收的字符相同，对于下一个正确的状态也会产生不同的结果，具体取决于当前的状态。该算法相当复杂，无法在此详述，所以我们通过一个简单的示例来帮助大家理解其原理。

　　基本示例 - 将下面的 HTML 代码标记化：

Hello world

1
2
3
4
5
　　初始状态是数据状态。遇到字符 < 时，状态更改为“标记打开状态”。接收一个 a-z字符会创建“起始标记”，状态更改为“标记名称状态”。这个状态会一直保持到接收> 字符。在此期间接收的每个字符都会附加到新的标记名称上。在本例中，我们创建的标记是 html 标记。

　　遇到 > 标记时，会发送当前的标记，状态改回“数据状态”。标记也会进行同样的处理。目前 html 和 body 标记均已发出。现在我们回到“数据状态”。接收到 Hello world 中的 H 字符时，将创建并发送字符标记，直到接收中的<。我们将为 Hello world 中的每个字符都发送一个字符标记。

　　现在我们回到“标记打开状态”。接收下一个输入字符 / 时，会创建 end tag token 并改为“标记名称状态”。我们会再次保持这个状态，直到接收 >。然后将发送新的标记，并回到“数据状态”。输入也会进行同样的处理。

对示例输入进行标记化

图3.6：对示例输入进行标记化
7.树构建算法
　　在创建解析器的同时，也会创建 Document 对象。在树构建阶段，以 Document 为根节点的 DOM 树也会不断进行修改，向其中添加各种元素。标记生成器发送的每个节点都会由树构建器进行处理。规范中定义了每个标记所对应的 DOM 元素，这些元素会在接收到相应的标记时创建。这些元素不仅会添加到 DOM 树中，还会添加到开放元素的堆栈中。此堆栈用于纠正嵌套错误和处理未关闭的标记。其算法也可以用状态机来描述。这些状态称为“插入模式”。

　　让我们来看看示例输入的树构建过程：

Hello world

1
2
3
4
5
　　树构建阶段的输入是一个来自标记化阶段的标记序列。第一个模式是“initial mode”。接收 HTML 标记后转为“before html”模式，并在这个模式下重新处理此标记。这样会创建一个 HTMLHtmlElement 元素，并将其附加到 Document 根对象上。

　　然后状态将改为“before head”。此时我们接收“body”标记。即使我们的示例中没有“head”标记，系统也会隐式创建一个 HTMLHeadElement，并将其添加到树中。

　　现在我们进入了“in head”模式，然后转入“after head”模式。系统对 body 标记进行重新处理，创建并插入 HTMLBodyElement，同时模式转变为“body”。

　　现在，接收由“Hello world”字符串生成的一系列字符标记。接收第一个字符时会创建并插入“Text”节点，而其他字符也将附加到该节点。

　　接收 body 结束标记会触发“after body”模式。现在我们将接收 HTML 结束标记，然后进入“after after body”模式。接收到文件结束标记后，解析过程就此结束。

示例 HTML 的树构建

图3.7：示例 HTML 的树构建
8.解析结束后的操作
　　在此阶段，浏览器会将文档标注为交互状态，并开始解析那些处于“deferred”模式的脚本，也就是那些应在文档解析完成后才执行的脚本。然后，文档状态将设置为“完成”，一个“加载”事件将随之触发。您可以在 HTML5 规范中查看标记化和树构建的完整算法

9.浏览器的容错机制
　　您在浏览 HTML 网页时从来不会看到“语法无效”的错误。这是因为浏览器会纠正任何无效内容，然后继续工作。

　　以下面的 HTML 代码为例：

Really lousy HTML

1
2
3
4
5
6
7
8
9
　　在这里，我已经违反了很多语法规则（“mytag”不是标准的标记，“p”和“div”元素之间的嵌套有误等等），但是浏览器仍然会正确地显示这些内容，并且毫无怨言。因为有大量的解析器代码会纠正 HTML 网页作者的错误。

　　不同浏览器的错误处理机制相当一致，但令人称奇的是，这种机制并不是 HTML 当前规范的一部分。和书签管理以及前进/后退按钮一样，它也是浏览器在多年发展中的产物。很多网站都普遍存在着一些已知的无效 HTML 结构，每一种浏览器都会尝试通过和其他浏览器一样的方式来修复这些无效结构。

　　HTML5 规范定义了一部分这样的要求。Webkit 在 HTML 解析器类的开头注释中对此做了很好的概括。

解析器对标记化输入内容进行解析，以构建文档树。如果文档的格式正确，就直接进行解析。

遗憾的是，我们不得不处理很多格式错误的 HTML 文档，所以解析器必须具备一定的容错性。

我们至少要能够处理以下错误情况：

明显不能在某些外部标记中添加的元素。在此情况下，我们应该关闭所有标记，直到出现禁止添加的元素，然后再加入该元素。
我们不能直接添加的元素。这很可能是网页作者忘记添加了其中的一些标记（或者其中的标记是可选的）。这些标签可能包括：HTML HEAD BODY TBODY TR TD LI（还有遗漏的吗？）。
向 inline 元素内添加 block 元素。关闭所有 inline 元素，直到出现下一个较高级的 block 元素。
如果这样仍然无效，可关闭所有元素，直到可以添加元素为止，或者忽略该标记。
　　让我们看一些 Webkit 容错的示例：

使用了而不是

　　有些网站使用了而不是
。为了与 IE 和 Firefox 兼容，Webkit 将其与
做同样的处理。
　　代码如下：

if (t->isCloseTag(brTag) && m_document->inCompatMode()) {
reportError(MalformedBRError);
t->beginTag = true;
}
1
2
3
4
　　请注意，错误处理是在内部进行的，用户并不会看到这个过程。
离散表格
　　离散表格是指位于其他表格内容中，但又不在任何一个单元格内的表格。
　　比如以下的示例：
　　

inner table

outer table

1
2
3
4
5
6
　　Webkit 会将其层次结构更改为两个同级表格：
　　

outer table

inner table

1
2
3
4
5
6
　　代码如下：

if (m_inStrayTableContent && localName == tableTag)
popBlock(tableTag);
1
2
　　Webkit 使用一个堆栈来保存当前的元素内容，它会从外部表格的堆栈中弹出内部表格。现在，这两个表格就变成了同级关系。
嵌套的表单元素
　　如果用户在一个表单元素中又放入了另一个表单，那么第二个表单将被忽略。
　　
　　代码如下：

if (!m_currentFormElement) {
m_currentFormElement = new HTMLFormElement(formTag, m_document);
}
1
2
3
过于复杂的标记层次结构
　　代码的注释已经说得很清楚了。

示例网站 www.liceo.edu.mx 嵌套了约 1500 个标记，全都来自一堆 标记。我们只允许最多 20 层同类型标记的嵌套，如果再嵌套更多，就会全部忽略。

bool HTMLParser::allowNestedRedundantTag(const AtomicString& tagName)
{

unsigned i = 0;
for (HTMLStackElem* curr = m_blockStack;
i < cMaxRedundantTagDepth && curr && curr->tagName == tagName;
curr = curr->next, i++) { }
return i != cMaxRedundantTagDepth;
}
1
2
3
4
5
6
7
8
9
放错位置的 html 或者 body 结束标记。

同样，代码的注释已经说得很清楚了。支持格式非常糟糕的 HTML 代码。我们从不关闭 body 标记，因为一些愚蠢的网页会在实际文档结束之前就关闭。我们通过调用 end() 来执行关闭操作。

if (t->tagName == htmlTag || t->tagName == bodyTag )
return;
1
2
　　所以网页作者需要注意，除非您想作为反面教材出现在 Webkit 容错代码段的示例中，否则还请编写格式正确的 HTML 代码。

3.3 CSS 解析
　　还记得简介中解析的概念吗？和HTML不同，CSS是上下文无关的语法，可以使用简介中描述的各种解析器进行解析。事实上，CSS 规范定义了 CSS 的词法和语法。让我们来看一些示例：

　　词法(词汇)是针对各个标记用正则表达式定义的：

comment \/*[^]*+([^/][^]*+)\/
num [0-9]+|[0-9]*”.”[0-9]+
nonascii [\200-\377]
nmstart [_a-z]|{nonascii}|{escape}
nmchar [_a-z0-9-]|{nonascii}|{escape}
name {nmchar}+
ident {nmstart}{nmchar}*
1
2
3
4
5
6
7
　　“ident”是标识符 (identifier) 的缩写，比如类名。”name”是元素的 ID（通过”#”来引用）。

　　语法是采用 BNF 格式描述的。

ruleset

selector [ ‘,’ S* selector ]*
‘{’ S* declaration [ ‘;’ S* declaration ]* ‘}’ S*
;
selector

simple_selector [ combinator selector | S+ [ combinator? selector ]? ]?
;
simple_selector

‘.’ IDENT
;
element_name

IDENT | ‘*’
;
attrib

‘[’ S* IDENT S* [ [ ‘=’ | INCLUDES | DASHMATCH ] S*
[ IDENT | STRING ] S* ] ‘]’
;
pseudo

‘:’ [ IDENT | FUNCTION S* [IDENT S*] ‘)’ ]
;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
　　解释：这是一个规则集的结构：

div.error , a.error {
color:red;
font-weight:bold;
}
1
2
3
4
　　div.error 和 a.error 是选择器。大括号内的部分包含了由此规则集应用的规则。此结构的正式定义是这样的：

ruleset

selector [ ‘,’ S* selector ]*
‘{’ S* declaration [ ‘;’ S* declaration ]* ‘}’ S*
;
1
2
3
4
　　
　　这表示一个规则集就是一个选择器，或者由逗号和空格（S 表示空格）分隔的多个（数量可选）选择器。规则集包含了大括号，以及其中的一个或多个（数量可选）由分号分隔的声明。“声明”和“选择器”将由下面的 BNF 格式定义。

1.Webkit CSS 解析器
　　Webkit 使用 Flex 和 Bison 解析器生成器，通过 CSS 语法文件自动创建解析器。正如我们之前在解析器简介中所说，Bison 会创建自下而上的移位归约解析器。Firefox 使用的是人工编写的自上而下的解析器。这两种解析器都会将 CSS 文件解析成 StyleSheet 对象，且每个对象都包含 CSS 规则。CSS 规则对象则包含选择器和声明对象，以及其他与 CSS 语法对应的对象。

解析 CSS

图3.8：解析 CSS
3.4 处理脚本和样式表的顺序
1.脚本
　　网络的模型是同步的。网页作者希望解析器遇到

div1 {color:blue}

div2 {color:green}

1
2
3
4
5
6
为了简便起见，我们只需要填充两个结构：color 结构和 margin 结构。color 结构只包含一个成员（即“color”），而 margin 结构包含四条边。
形成的规则树如下图所示（节点的标记方式为“节点名 : 指向的规则序号”）：

规则树1

图4.2：规则树
　　上下文树如下图所示（节点名 : 指向的规则节点）：

上下文树

图4.3：上下文树
　　假设我们解析 HTML 时遇到了第二个

标记，我们需要为此节点创建样式上下文，并填充其样式结构。
　　经过规则匹配，我们发现该
的匹配规则是第 1、2 和 6 条。这意味着规则树中已有一条路径可供我们的元素使用，我们只需要再为其添加一个节点以匹配第 6 条规则（规则树中的 F 节点）。
　　我们将创建样式上下文并将其放入上下文树中。新的样式上下文将指向规则树中的 F 节点。
　　现在我们需要填充样式结构。首先要填充的是 margin 结构。由于最后的规则节点 (F) 并没有添加到 margin 结构，我们需要上溯规则树，直至找到在先前节点插入中计算过的缓存结构，然后使用该结构。我们会在指定 margin 规则的最上层节点（即 B 节点）上找到该结构。

　　我们已经有了 color 结构的定义，因此不能使用缓存的结构。由于 color 有一个属性，我们无需上溯规则树以填充其他属性。我们将计算端值（将字符串转化为 RGB 等）并在此节点上缓存经过计算的结构。

　　第二个元素处理起来更加简单。我们将匹配规则，最终发现它和之前的 span 一样指向规则 G。由于我们找到了指向同一节点的同级，就可以共享整个样式上下文了，只需指向之前 span 的上下文即可。

　　对于包含了继承自父代的规则的结构，缓存是在上下文树中进行的（事实上 color 属性是继承的，但是 Firefox 将其视为 reset 属性，并缓存到规则树上）。
例如，如果我们在某个段落中添加 font 规则：

p {font-family:Verdana;font size:10px;font-weight:bold}
　　那么，该段落元素作为上下文树中的 div 的子代，就会共享与其父代相同的 font 结构（前提是该段落没有指定 font 规则）。
　　在 Webkit 中没有规则树，因此会对匹配的声明遍历 4 次。首先应用非重要高优先级的属性（由于作为其他属性的依据而应首先应用的属性，例如 display），接着是高优先级重要规则，然后是普通优先级非重要规则，最后是普通优先级重要规则。这意味着多次出现的属性会根据正确的层叠顺序进行解析。最后出现的最终生效。

　　因此概括来说，共享样式对象（整个对象或者对象中的部分结构）可以解决问题 1和问题 3。Firefox 规则树还有助于按照正确的顺序应用属性。

3.对规则进行处理以简化匹配
　　样式规则有一些来源：

外部样式表或样式元素中的 CSS 规则

p {color:blue}
inline 样式属性及类似内容

messageDiv {height:50px}

div {margin:5px}
1
2
3
　　第一条规则将插入类表，第二条将插入 ID 表，而第三条将插入标记表。
　　对于下面的 HTML 代码段：

an error occurred

this is a message

1 2 　　我们首先会为 p 元素寻找匹配的规则。类表中有一个“error”键，在下面可以找到“p.error”的规则。div 元素在 ID 表（键为 ID）和标记表中有相关的规则。剩下的工作就是找出哪些根据键提取的规则是真正匹配的了。　　例如，如果 div 的对应规则如下： table div {margin:5px} 1 　　这条规则仍然会从标记表中提取出来，因为键是最右边的选择器，但这条规则并不匹配我们的 div 元素，因为 div 没有 table 祖先。　　Webkit 和 Firefox 都进行了这一处理。 4.以正确的层叠顺序应用规则　　样式对象具有每个可视化属性一一对应的属性（均为 CSS 属性但更为通用）。如果某个属性未由任何匹配规则所定义，那么部分属性就可由父代元素样式对象继承。其他属性具有默认值。如果定义不止一个，就会出现问题，需要通过层叠顺序来解决。 1)样式表层叠顺序　　某个样式属性的声明可能会出现在多个样式表中，也可能在同一个样式表中出现多次。这意味着应用规则的顺序极为重要。这称为“层叠”顺序。根据 CSS2 规范，层叠的顺序为（优先级从低到高）：浏览器声明用户普通声明作者普通声明作者重要声明用户重要声明　　浏览器声明是重要程度最低的，而用户只有将该声明标记为“重要”才可以替换网页作者的声明。同样顺序的声明会根据特异性进行排序，然后再是其指定顺序。HTML 可视化属性会转换成匹配的 CSS 声明。它们被视为低优先级的网页作者规则。 2)特异性　　选择器的特异性由 CSS2 规范定义如下：如果声明来自于“style”属性，而不是带有选择器的规则，则记为 1，否则记为 0 (= a) 记为选择器中 ID 属性的个数 (= b) 记为选择器中其他属性和伪类的个数 (= c) 记为选择器中元素名称和伪元素的个数 (= d) 　　将四个数字按 a-b-c-d 这样连接起来（位于大数进制的数字系统中），构成特异性。　　您使用的进制取决于上述类别中的最高计数。　　例如，如果 a=14，您可以使用十六进制。如果 a=17，那么您需要使用十七进制；当然不太可能出现这种情况，除非是存在如下的选择器：html body div div p …（在选择器中出现了 17 个标记，这样的可能性极低）。　　一些示例： - {} /* a=0 b=0 c=0 d=0 -> specificity = 0,0,0,0 */ li {} /* a=0 b=0 c=0 d=1 -> specificity = 0,0,0,1 */ li:first-line {} /* a=0 b=0 c=0 d=2 -> specificity = 0,0,0,2 */ ul li {} /* a=0 b=0 c=0 d=2 -> specificity = 0,0,0,2 */ ul ol+li {} /* a=0 b=0 c=0 d=3 -> specificity = 0,0,0,3 */ h1 + *[rel=up]{} /* a=0 b=0 c=1 d=1 -> specificity = 0,0,1,1 */ ul ol li.red {} /* a=0 b=0 c=1 d=3 -> specificity = 0,0,1,3 */ li.red.level {} /* a=0 b=0 c=2 d=1 -> specificity = 0,0,2,1 */ #x34y {} /* a=0 b=1 c=0 d=0 -> specificity = 0,1,0,0 */ style=”” /* a=1 b=0 c=0 d=0 -> specificity = 1,0,0,0 */ 1 2 3 4 5 6 7 8 9 10 3)规则排序　　找到匹配的规则之后，应根据级联顺序将其排序。Webkit 对于较小的列表会使用冒泡排序，而对较大的列表则使用归并排序。对于以下规则，Webkit 通过替换“>”运算符来实现排序： static bool operator >(CSSRuleData& r1, CSSRuleData& r2) { int spec1 = r1.selector()->specificity(); int spec2 = r2.selector()->specificity(); return (spec1 == spec2) : r1.position() > r2.position() : spec1 > spec2; } 1 2 3 4 5 6 4.4 渐进式处理　　Webkit 使用一个标记来表示是否所有的顶级样式表（包括 @imports）均已加载完毕。如果在附加过程中尚未完全加载样式，则使用占位符，并在文档中进行标注，等样式表加载完毕后再重新计算。第五章布局　　呈现器在创建完成并添加到渲染树时，并不包含位置和大小信息。计算这些值的过程称为布局或重排。　　HTML 采用基于流的布局模型，这意味着大多数情况下只要一次遍历就能计算出几何信息。处于流中靠后位置元素通常不会影响靠前位置元素的几何特征，因此布局可以按从左至右、从上至下的顺序遍历文档。但是也有例外情况，比如 HTML 表格的计算就需要不止一次的遍历。　　坐标系是相对于根框架而建立的，使用的是上坐标和左坐标。　　布局是一个递归的过程。它从根呈现器（对应于 HTML 文档的元素）开始，然后递归遍历部分或所有的框架层次结构，为每一个需要计算的呈现器计算几何信息。　　根呈现器的位置左边是 0,0，其尺寸为视口（也就是浏览器窗口的可见区域）。　　所有的呈现器都有一个“laybout”或者“reflow”方法，每一个呈现器都会调用其需要进行布局的子代的 layout 方法。 5.1 Dirty 位系统　　为避免对所有细小更改都进行整体布局，浏览器采用了一种“dirty 位”系统。如果某个呈现器发生了更改，或者将自身及其子代标注为“dirty”，则需要进行布局。　　有两种标记：“dirty”和“children are dirty”。“children are dirty”表示尽管呈现器自身没有变化，但它至少有一个子代需要布局。 5.2 全局布局和增量布局　　全局布局是指触发了整个渲染树范围的布局，触发原因可能包括：影响所有呈现器的全局样式更改，例如字体大小更改。屏幕大小调整。　　布局可以采用增量方式，也就是只对 dirty 呈现器进行布局（这样可能存在需要进行额外布局的弊端）。当呈现器为 dirty 时，会异步触发增量布局。例如，当来自网络的额外内容添加到 DOM 树之后，新的呈现器附加到了渲染树中。增量布局图5.1：增量布局 - 只有 dirty 呈现器及其子代进行布局 5.3 异步布局和同步布局　　增量布局是异步执行的。Firefox 将增量布局的“reflow 命令”加入队列，而调度程序会触发这些命令的批量执行。Webkit 也有用于执行增量布局的计时器：对渲染树进行遍历，并对 dirty 呈现器进行布局。　　请求样式信息（例如“offsetHeight”）的脚本可同步触发增量布局。　　全局布局往往是同步触发的。　　有时，当初始布局完成之后，如果一些属性（如滚动位置）发生变化，布局就会作为回调而触发。 5.4 优化　　如果布局是由“大小调整”或呈现器的位置（而非大小）改变而触发的，那么可以从缓存中获取呈现器的大小，而无需重新计算。在某些情况下，只有一个子树进行了修改，因此无需从根节点开始布局。这适用于在本地进行更改而不影响周围元素的情况，例如在文本字段中插入文本（否则每次键盘输入都将触发从根节点开始的布局）。 5.5 布局处理　　布局通常具有以下模式：父呈现器确定自己的宽度。父呈现器依次处理子呈现器，并且：放置子呈现器（设置 x,y 坐标）。如果有必要，调用子呈现器的布局（如果子呈现器是 dirty 的，或者这是全局布局，或出于其他某些原因），这会计算子呈现器的高度。父呈现器根据子呈现器的累加高度以及边距和补白的高度来设置自身高度，此值也可供父呈现器的父呈现器使用。将其 dirty 位设置为 false。　　Firefox 使用“state”对象 (nsHTMLReflowState) 作为布局的参数（称为“reflow”），这其中包括了父呈现器的宽度。　　Firefox 布局的输出为“metrics”对象 (nsHTMLReflowMetrics)，其包含计算得出的呈现器高度。 5.6 宽度计算　　呈现器宽度是根据容器块的宽度、呈现器样式中的“width”属性以及边距和边框计算得出的。例如以下 div 的宽度：