100.精读《V8 引擎 Lazy Parsing》

最新推荐文章于 2022-09-25 19:04:47 发布

黄子毅

最新推荐文章于 2022-09-25 19:04:47 发布

阅读量328

点赞数

本文链接：https://blog.csdn.net/ascoders/article/details/100409669

版权

1. 引言

本周精读的文章是 V8 引擎 Lazy Parsing，看看 V8 引擎为了优化性能，做了怎样的尝试吧！

这篇文章介绍的优化技术叫 preparser，是通过跳过不必要函数编译的方式优化性能。

2. 概述 & 精读

解析 Js 发生在网页运行的关键路径上，因此加速对 JS 的解析，就可以加速网页运行效率。

然而并不是所有 Js 都需要在初始化时就被执行，因此也不需要在初始化时就解析所有的 Js！因为编译 Js 会带来三个成本问题：

编译不必要的代码会占用 CPU 资源。
在 GC 前会占用不必要的内存空间。
编译后的代码会缓存在磁盘，占用磁盘空间。

因此所有主流浏览器都实现了 Lazy Parsing（延迟解析），它会将不必要的函数进行预解析，也就是只解析出外部函数需要的内容，而全量解析在调用这个函数时才发生。

预解析的挑战

本来预解析也不难，因为只要判断一个函数是否会立即执行就可以了，只有立即执行的函数才需要被完全解析。

使得预解析变复杂的是变量分配问题。原文通过了堆栈调用的例子说明原因：

Js 代码的执行在堆栈上完成，比如下面这个函数：

function f(a, b) {
const c = a + b;
return c;
}

function g() {
return f(1, 2);
// The return instruction pointer of `f` now points here
// (because when `f` `return`s, it returns here).
}

这段函数的调用堆栈如下：

640?wx_fmt=png

首先是全局 This globalThis，然后执行到函数 f，再对 a b 进行赋值。在执行 f 函数时，通过 <rip g>(return instruction pointer) 保存 g 堆栈状态，再保存堆栈跳出后返回位置的指针 <save fp>(frame pointer)，最后对变量 c 赋值。

这看上去没有问题，只要将值存在堆栈就搞定了。但是将变量定义到函数内部就不一样了：

function make_f(d) {
// ← declaration of `d`
return function inner(a, b) {
const c = a + b + d; // ← reference to `d`
return c;
  };
}

const f = make_f(10);

function g() {
return f(1, 2);
}

将变量 d 申明在函数 make_f 中，且在返回函数 inner 中用到了 d。那么函数的调用栈就变成了这样：

640?wx_fmt=png

需要创建一个 context 存储函数 f 中变量 d 的值。

也就是说，如果一个在函数内部定义的变量被子 Scope 使用时，Js 引擎需要识别这种情况，并将这个变量值存储在 context 中。

所以对于函数定义的每一个入参，我们需要知道其是否会被子函数引用。也就是说，在 preparser 阶段，我们只要少能分析出哪些变量被内部函数引用了。

难以分辨的引用

预处理器中跟踪变量的申明与引用很复杂，因为 Js 的语法导致了无法从部分表达式推断含义，比如下面的函数：

function f(d) {
function g() {
const a = ({ d }

我们不清楚第三行的 d 到底是不是指代第一行的 d。它可能是：

function f(d) {
function g() {
const a = ({ d } = { d: 42 });
return a;
  }
return g;
}

也可能只是一个自定义函数参数，与上面的 d 无关：

function f(d) {
function g() {
const a = ({ d }) => d;
return a;
  }

return [d, g];
}

惰性 parse

在执行函数时，只会将最外层执行的函数完全编译并生成 AST，而对内部模块只进行 preparser。

// This is the top-level scope.
function outer() {
// preparsed
function inner() {
// preparsed
  }
}

outer(); // Fully parses and compiles `outer`, but not `inner`.

为了允许惰性编译函数，上下文指针指向了 ScopeInfo 的对象（从代码中可以看到，ScopeInfo 包含上下文信息，比如当前上下文是否有函数名，是否在一个函数内等等），当编译内部函数时，可以利用 ScopeInfo 继续编译子函数。

但是为了判断惰性编译函数自身是否需要一个上下文，我们需要再次解析内部的函数：比如我们需要知道某个子函数是否对外层函数定义的变量有所引用。

这样就会产生递归遍历：

640?wx_fmt=jpeg

由于代码总会包含一些嵌套，而编译工具更会产生 IIFE(立即调用函数) 这种多层嵌套的表达式，使得递归性能比较差。

而下面有一种办法可以将时间复杂度简化为线性：将变量分配的位置序列化为一个密集的数组，当惰性解析函数时，变量会按照原先的顺序重新创建，这样就不需要因为子函数可能引用外层定义变量的原因，对所有子函数进行递归惰性解析了。

按照这种方式优化后的时间复杂度是线性的：

640?wx_fmt=jpeg

针对模块化打包的优化

由于现代代码几乎都是模块化编写的，构建起在打包时会将模块化代码封装在 IIFE（立即调用的闭包）中，以保证模拟模块化环境运行。比如 (function(){....})()。

这些代码看似在函数中应该惰性编译，但其实这些模块化代码从一开始就要被编译，否则反而会影响性能，因此 V8 有两种机制识别这些可能被立即调用的函数：

如果函数是带括号的，比如 (function(){...})，就假设它会被立即调用。
从 V8 v5.7 / Chrome 57 开始，还会识别 uglifyJS 的 !function(){...}(), function(){...}(), function(){...}() 这种模式。

然而在浏览器引擎解析环境比较复杂，很难对函数进行完整字符串匹配，因此只能对函数头进行简单判断。所以对于下面这种匿名函数的行为，浏览器是不识别的：

// pre-parser
function run(func) {
func()
}

run(function(){}) // 在这执行它，进行 full parser

上面的代码看上去没毛病，但由于浏览器只检测被括号括住的函数，因此这个函数不被认为是立即执行函数，因此在后续执行时会被重复 full-parse。

也有一些代码辅助转换工具帮助 V8 正确识别，比如 optimize-js，会将代码做如下转换。

转换前：

!function (){}()
function runIt(fun){ fun() }
runIt(function (){})

转换后：

!(function (){})()
function runIt(fun){ fun() }
runIt((function (){}))

然而在 V8 v7.5+ 已经很大程度解决了这个问题，因此现在其实不需要使用 optimize-js 这种库了～

4. 总结

JS 解析引擎在性能优化做了不少工作，但同时也要应对代码编译器产生的特殊 IIFE 闭包，防止对这种立即执行闭包进行重复 parser。

最后，不要试图总是将函数用括号括起来，因为这样会导致惰性编译的特性无法启用。

5.更多讨论

如果你想参与讨论，请关注前端精读周刊- 帮你筛选靠谱的内容。

640?wx_fmt=gif

以下是我个人微信，欢迎交流！

（如想获得阿里内推机会，发简历给我，邮箱地址：

ziyi.hzy@alibaba-inc.com

PS：招人阶段，欢迎大家砸简历~）

640?wx_fmt=jpeg

平时工作繁忙，写文实在不易，欢迎大家"转发"+"在看"，你们的支持是我继续写下去的动力，感谢！

点击“在看“或”转发“也是一种打赏???

6. 聊点其他的

这篇文章已经是前端精读周刊公众号的第100篇文章了，也算是一个里程碑式的节点了。从创建公号到更新至第100篇文章用了将近5个月的时间，不过这100篇文章都是以前发布在Github上的存货，后面就会慢慢更新最近几个月写的文章了，不过这也意味着，公号日更的节奏快要结束了，待公号的进度和Github的进度保持一致时，就要开始周更了。坚持写技术文章已经两年了，保持每周一篇精读文章也着实不易，但是保持写作的习惯不管在工作上还是生活上带给我的益处都是让我受益无穷的。

所以，趁着这个机会和关注我的读者讲一些自己这些年的感悟，在现在这个技术更新迭代飞速的年代，要想过得体面一些，不被甩在人后，必须要保持不断学习的态度，并且在实际上付出比别人多很多的精力，才能看起来不那么费力。作为一个资深码农，也不会说太多大道理，只希望关注我的读者也能保持不断学习的态度，我们一起进步！

好了，煽情完了，再打个广告，阿里数据中台部门现急招优秀的前端同学，如果你自信自己够优秀或觉得身边有比较优秀的前端伙伴，欢迎砸简历给我，邮箱地址：ziyi.hzy@alibaba-inc.com。

平时工作忙，可能来不及回复，但是等有空的时候，我一定会认真对待每一个关注我的读者。

黄子毅

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
100.精读《V8 引擎 Lazy Parsing》

1. 引言本周精读的文章是 V8 引擎 Lazy Parsing，看看 V8 引擎为了优化性能，做了怎样的尝试吧！这篇文章介绍的优化技术叫 preparser，是通过跳过...
复制链接

扫一扫