HTML 解释器

最新推荐文章于 2023-11-18 03:57:34 发布

山西仓江科技有限公司

最新推荐文章于 2023-11-18 03:57:34 发布

阅读量3.2k

点赞数 1

分类专栏： webkit 文章标签： webkit

本文链接：https://blog.csdn.net/qq_37653449/article/details/90762063

版权

HTML 解释器在WebKit中的工作流程包括词法分析、XSSAuditor验证、节点构建和DOM树生成。词法分析器HTMLTokenizer将字节流转化为词语，XSSAuditor确保安全，词语构建为节点并形成DOM树。JavaScript执行发生在DOM构建过程中，并使用事件机制处理用户交互。影子DOM用于封装复杂组件，避免样式冲突，事件处理则遵循捕获和冒泡机制。

摘要由CSDN通过智能技术生成

解释过程

HTML 解释器的工作就是将网络或者本地磁盘获取的 HTML 网页和资源从字节流解释成 DOM 树结构。这一过程大致可以理解成下图
在这里插入图片描述
WebKit 中这一过程如下：首先是字节流，经过解码之后是字符流，然后通过词法分析器把字符流解释成词语（Tokens），之后经过语法分析器构建成节点，最后这些节点被组建成一棵 DOM 树。

词法分析

在进行词法分析之前，解释器首先要做的事情就是检查该网页内容使用的编码格式，以便后面使用合适的解码器。如果解释器在 HTML 网页中找到了设置的编码格式， WebKit 会使用相应的解码器来将字节流转换成特定格式的字符串。如果没有特殊格式，词法分析器 HTMLTokenizer 类可以直接进行词法分析

词法分析的工作都是由 HTMLTokenizer 来完成，简单来说，它就是一个状态机---输入的是字符串，输出的是一个个词语。因为字节流可能是分段的，所以输入的字符串可能也是分段的，但是这对词法分析器来说没有什么特别之处，它会自己维护内部的状态信息。

XSSAuditor 验证词语

当词语生成之后，WebKit 需要使用 XSSAuditor 来验证词语流（Token Stream）。XSS 指的是 Cross Site Security , 主要是针对安全方面的考虑。

根据 XSS 的安全机制，对于解析出来的这些词语，可能会阻碍某些内容的进一步执行，所以 XSSAuditor 类主要负责过滤这些被阻止的内容，只有通过的词语才会作后面的处理

词语到节点

经过词法分析器解释之后的词语随之被 XSSAuditor 过滤并且在没有被阻止之后，将被 WebKit 用来构建 DOM 节点。从词语到构建节点的步骤是由 HTMLDocumentParser 类调用 HTMLTreeBuilder 类的 “constructTree” 函数来实现。

节点到 DOM 树

从节点到构建 DOM 树，包括为树中的元素节点创建属性节点等工作由 HTMLConstructionSite 类来完成。正如前面介绍的，该类包含一个 DOM 树的根节点 ——HTMLDocument 对象，其他的元素节点都是它的后代。

因为 HTML 文档的 Tag 标签是有开始和结束标记的，所以构建这一过程可以使用栈结构来帮忙。HTMLConstructionSite 类中包含一个 “HTMLElementStack” 变量，它是一个保存元素节点的栈，其中的元素节点是当前有开始标记但是还没有结束标记的元素节点。想象一下 HTML 文档的特点，例如一个片段 <body><div><img></img></div></body>当解释到 img 元素的开始标记时，栈中的元素就是 body 、div 和 img ,当遇到 img 的结束标记时，img 退栈， img 是 div 元素的子女；当遇到 div 的结束标记时，div 退栈，表明 div 和它的子女都已处理完，以此类推。

JavaScript 的执行

在 HTML 解释器的工作过程中，可能会有 JavaScript 代码（全局作用域的代码）需要执行，它发生在将字符串解释成词语之后、创建各种节点的时候。这也是全局执行的 JavaScript 代码不能访

最低0.47元/天解锁文章

山西仓江科技有限公司

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
HTML 解释器

解释过程HTML 解释器的工作就是将网络或者本地磁盘获取的 HTML 网页和资源从字节流解释成 DOM 树结构。这一过程大致可以理解成下图WebKit 中这一过程如下：首先是字节流，经过解码之后是字符流，然后通过词法分析器把字符流解释成词语（Tokens），之后经过语法分析器构建成节点，最后这些节点被组建成一棵 DOM 树。词法分析在进行词法分析之前，解释器首先要做的事情就是检查该网页内...
复制链接

扫一扫

专栏目录