1.编译原理
JavaScript 是一门编译语言。
传统编译语言中,程序中的源代码在执行之前会经历三个步骤,统称为“编译”:
- 分词/词法分析:将由字符组成的字符串分解成有意义的代码块,这些代码块被称为词法单元。
- 解析/语法分析:将词法单元流(数组)转换成一个由元素逐级嵌套所组成的代表了程序语法结构的树,这个树被称作“抽象语法树”(AST)。
- 代码生成:将 AST 转换为可执行代码的过程。
JavaScript 引擎进行编译的步骤和传统的编译语言非常相似,在某些环节可能比预想的要复杂。
2.理解作用域
理解作用域前需要了解三个角色:
- 引擎:从头到尾负责整个
JavaScript
程序的编译及执行过程。 - 编译器:负责语法分析及代码生成。
- 作用域:负责收集并维护由所有声明的标识符(变量)组成的一系列查询,并实施一套非常严格的规则,确定当前执行的代码对这些标识符的访问权限。
以 `var a = 2’ 为例,了解引擎、编译器以及作用域如何工作:
- 遇到
var a
,编译器会询问作用域是否已经有这个名称的变量存在于同一个作用域的集合中。如果是,编译器会忽略该声明,继续编译,否则会要求作用域在当前作用域的集合中声明一个新的变量,并命名为a
。 - 接下来编译器会为引擎生成运行时所需的代码,这些代码被用来处理
a=2
这个赋值操作。引擎运行时会首先询问作用域,在当前的作用域集合中是否存在一个叫做a
的变量。如果是,引擎就会使用这个变量;如果否,引擎会继续查找该变量。如果引擎最终找到了a
变量,就会将2
赋值给它。否则引擎就会抛出一个错误。
根据上面的例子,引擎会为变量 a
进行 LHS
。相应的还有另外一个查找类型是 RHS
。
RHS
(谁是赋值操作的源头):简单查找某个变量的值别无二致;
LHS
(赋值操作的目标是谁): 查询变量的容器本身。
例子:
cosnole.log(a);
//其中对 a 的引用是一个 RHS 引用, 因为这里的 a 并没有赋予任何值。
//相应地,需要查找并取得 a 的值,这样才能将值传递给 console.log(...)
a=2;
//这里对 a 的引用则是 LHS 引用,因为实际上我们并不关心当前的值是什么,只是想要为 =2 这个赋值操作找到目标
3.作用域嵌套
作用域嵌套的产生:当一个块或函数嵌套在另一个块或函数中时,就发生了作用域的嵌套。
遍历作用域链条的规则:引擎从当前的执行作用域开始查找变量,如果找不到,就向上一级继续查找。当抵达最外层的全局作用域时,无论找到还是没找到,查找过程都会停止。
4.异常
例子:
function foo(a){
console.log(a+b);
b=a;
}
foo(2);
第一次对 b 进行 RHS 查询时无法找到该变量的。
如果 RHS 查询在所有嵌套的作用域中遍寻不到所需的变量,引擎就会抛出
ReferenceError
异常。
当引擎执行 LHS 查询时,如果在顶层(全局作用域)中也无法找到目标变量,全局作用域中就会创建一个具有该名称的变量,并将其返还给引擎,前提是在程序运行在非“非严格模式”下。若是运行在“严格模式下”,严格模式禁止自动或隐藏式地创建全局变量。因此 LHS 查询失败,并不会创建并返回一个全局变量,引擎也会抛出ReferenceError
异常。
如果 RHS 查询找到一个变量,但是对这个变量的值进行不合理的操作(如引用null
或undefined
类型的值中的属性),那么引擎会抛出TypeError
。
ReferenceError
同作用域判别失败相关,而 TypeError
则代表作用域判别成功了,但是对结果的操作是非法或不合理的。
5.总结易混淆知识点
- 作用域是一套规则,用于确定在何处以及如何查找变量(标识符)。
- 查找的目的是对变量进行赋值,那么就会使用 LHS 查询。
- 查找的目的是获取变量的值,就会使用 RHS 查询。
- 赋值操作会导致 LHS 查询。(= 操作符或调用函数时传入参数的操作都会导致关联作用域的赋值操作)