主要内容:
- 理解基本类型和引用类型的值
- 理解执行环境
- 理解垃圾收集
按ECMA-262的定义,JavaScript变量松散类型的本质,决定了它只是在特定时间用于保存特定值的一个名字而已。由于不存在定义某个变量必须要保存何种数据类型的规则,变量的值及其数据类型可以在脚本的生命周期内改变。尽管从某种角度看,这可能是一个既有趣又强大,同时又容易出问题的特性,但JavaScript变量实际的复杂程度远不止如此。
4.1 基本类型和引用类型的值
ECMAScript变量包含两种不同数据类型的值:基本类型值和引用类型值。
- 基本类型值:是指简单的数据段;
- 引用类型值:是指那些可能由多个值构成的对象。
在将一个值赋给变量时,解析器必须确定这个值是基本类型值还是引用类型值。之前讨论了5中基本数据类型,Undefined、Null、Number、Boolean和String。它们是按值访问的,因为可以操作保存在变量中的实际值。
引用类型的值是保存在内存中的对象。与其他语言不通,JavaScript不允许直接访问内存中的位置,也就是说不能直接操作对象的内存空间。在操作对象时,实际上是在操作对象的引用而不是实际的对象。为此,引用类型的值是按引用访问的。
在很多语言中,字符串以对象的形式来表示,因此被认为是引用类型的。ECMAScript放弃了这一传统。
4.1.1 动态的属性
定义基本类型值和引用类型值的方式是类似的:创建一个变量并为该变量赋值。但是,当这个值保存到变量中以后,对不同类型值可以执行的操作则大相径庭。对于引用类型的值,我们可以为其添加属性和方法,也可以改变盒删除其属性和方法。举例如下:
var person = new Object();
person.name = "Nicholas";
alert("person.name"); //Nicholas
创建对象保存在变量person中,添加name属性,赋值“Nicholas”,如果对象不被销毁或属性不被删除,则这个属性将一直存在。
但我们不能给基本类型的值添加属性,尽管不会导致错误,错误举例如下:
var name = "Nicholas";
name.age = 27;
alert(name.age); // undefined
4.1.2 复制变量值
基本类型的复制,会在变量对象上创建一个新值,然后将值复制到新变量分配的位置上。
var num1 = 5;
var num2 = num1;
得到的num2中的5与num1中的5是完全独立的,该值只是num1中5的一个副本,两个变量不会互相影响。
但是,当一个变量向另一个变量复制引用类型的值时,同样也会将存储在变量对象中的值复制一份放到新变量分配的空间中。区别是,这个值的副本实际是一个指针,指向存储在堆中的一个对象。复制操作结束后,两个变量实际上将引用同一个对象。因此,改变其中一个变量,就会影响另一个变量,举例如下:
var obj1 = new Object();
var obj2 = obj1;
obj1.name = "Nicholas";
alert(obj2.name); //Nicholas
4.1.3 传递参数
ECMAScript中所有函数的参数都是按值传递的。即,把函数外部的值复制给函数内部的参数,就和把值从一个变量复制到另一个变量一样。
在想参数传递基本类型的值时,被传递的值会被复制给一个局部变量(即命名参数,或者用ECMAScript的概念来说,就是arguments对象中的一个元素)。在向参数传递引用类型的值时,会把这个值在内存中的地址复制给一个局部变量,因此这个局部变量的变化会反映在函数的外部。举例如下:
function addTen(num) {
num += 10;
return num;
}
var count = 20;
var result = addTen(count);
alert(count); //20,没有变化
alert(result); //30
函数addTen()里的参数num,是函数的局部变量。因此,不会影响函数外部的count变量。
如果使用对象来按值传递参数,举例如下:
function setName(obj) {
obj.name = "Nicholas";
}
var person = new Object();
setName(person);
alert(person.name); //Nicholas
这里,obj和person引用的是同一个对象。因此,person也有所反映。
误区:错误的认为在局部作用域中修改的对象会在全局作用域中反映出来,就说明参数是按引用传递的。举例如下:
function setName(obj) {
obj.name = "Nicholas";
obj = new Object();
obj.name = "Greg";
}
var person = new Object();
setName(person);
alert(person.name); //Nicholas
这里,重新定义了obj对象,并给该对象定义了一个不同的name属性。如果person是按引用传递的,那么person就会自动被修改为指向其name属性值为“Greg”的新对象。但是,当接下来访问person.name时,显示的值仍然是Nicholas。说明,即使在函数内部修改了参数的值,但原来的引用仍然保持未变。实际上,当在函数内部重新obj时,这个变量引用的就是一个局部对象了。而这个局部对象会在函数执行完毕后立即被销毁。
可以把ECMAScript函数的参数想象成局部变量。
4.1.4 检测类型
上面typeof操作符是最佳的检测工具,来检测是否是基本数据类型。当值为null或Object,都会返回Object。
var s = "Nicholas";
var b = true;
var i = 22;
var u;
var n = null;
var o = new Object();
alert(type of s); //string
alert(type of i); //boolean
alert(type of b); //number
alert(type of u); //undefined
alert(type of n); //object
alert(type of o); //object
当需要知道是什么类型的对象时,ECMAScript提供了instanceof操作符:
result = variable instanceof constructor
如果变量是给定义引用类型的实例,那么instanceof操作符就会返回true,举例如下:
alert(person instanceof Object); //变量person是Object吗?
alert(colors instanceof Array); //变量colors是Array吗?
alert(pattern instanceof RegExp) //变量pattern是RegExp吗?
根据规定,所有引用类型的值都是Object实例。因此,在检测一个引用类型值和Object构造函数时,instanceof操作符始终会返回true。如果用instanceof操作符检测基本类型的值时,会返回false,因为基本类型不是对象。
使用typeof操作符检测函数时,会返回function。在Safari5及之前版本和Chrome7及之前版本中使用typeof检测正则表达式时,由于规范的原因,这个操作符也返回function。ECMA-262规定任何在内部实现[call]方法的对象都应该在应用typeof操作符时返回function。由于上述浏览器中的正则表达式也实现了这个方法,因此是对正则表达式应用typeof会返回function。在IE和Firefox中,对正则表达式应用typeof会返回object。
4.2 执行环境及作用域
执行环境定义了变量或函数有权访问的其他数据,决定了它们各自的行为。每个执行环境都有一个与之关联的变量对象(variable object),环境中定义的所有变量和函数都保存在这个对象中。虽然编写的代码无法访问这个对象,但解析器在处理数据时会在后台使用它。
全局执行环境:最外围的一个执行环境,根据ECMAScript实现所在的宿主环境不同,执行环境的对象也不一样。在Web浏览器中,全局执行环境被认为是window对象。因此所有全局变量和函数都是作为window对象的属性和方法创建的。某个执行环境中的所有代码执行完毕后,该环境被销毁,保存在其中的所有变量和函数定义也随之销毁(全局执行环境直到应用程序退出–例如关闭网页或浏览器时才会被销毁)。
每个函数都有自己的执行环境。当执行流进入一个函数时,函数的环境就会被推入一个环境栈中。而在函数执行之后,栈将其环境弹出,把控制权返回给之前的执行环境。ECMAScript程序中的执行流正是由这个方便的机制控制着。
当代码在一个环境中执行时,会创建变量对象的一个作用域链(scope chain),保证对执行环境有权访问的所有变量和函数的有序访问。作用域链的顶端,始终都是当前执行的代码所在环境的变量对象。如果这个环境是函数,则将其活动对象(activation object)作为变量对象。活动对象在最开始时是只包含一个变量,即arguments对象(这个对象在全局环境中是不存在的)。作用域链中的下一个变量对象来自包含(外部)环境,而再下一个变量对象则来自下一个包含环境。这样,一直延续到全局执行环境:全局执行环境的变量对象始终都是作用域链中的最后一个对象。
标识符解析是沿着作用域链一级一级地搜索标识符的过程。搜索过程始终从作用域链的前端开始。然后逐级地向后回溯,直到找到标识符为止(如果找不到标识符,通常会导致错误发生)。举例代码:
var color = "blue";
function changeColor(){
if(color === "blue") {
color = "red";
} else {
color = "blue";
}
}
changeColor();
alert("Color is now" + color);
上述例子中,函数changeColor()的作用域链包含两个对象:它自己的变量对象(其中定义这arguments对象)和全局环境的变量对象。可以在函数内部访问变量color,就是因为可以在这个作用域链中找到它。
此外,在局部作用域中定义的变量可以在局部环境中与全局变量互换使用,举例如下:
var color = "blue";
function changeColor(){
var anotherColor = "red";
function swapColors(){
var tempColor = anotherColor;
anotherColor = color;
color = tempColor;
//这里可以访问color、anotherColor和tempColor
}
//这里可以访问color和anotherColor,但不能访问tempColor
swapColor();
}
//这里只能访问color
changeColor();
上述代码共涉及3个执行环境:全局环境、changeColor()的局部环境和swapColors()的局部环境。
全局环境中有一个变量color和一个函数changeColor()。changeColor()的局部环境中由一个名为anotherColor的变量和一个名为swapColors()的函数,但它也可以访问全局环境中的变量color。swapColor()的局部环境中有一个变量tempColor,该变量只能在这个环境中访问到。无论全局环境还是changeColor()的局部环境都无权访问tempColor。然而,在swapColors()内部则可以访问其他两个环境中的所有变量,因为那两个环境是它的父执行环境。
注意:内部环境可以通过作用域链访问所有的外部环境,但外部环境不能访问内部环境中的任何变量和函数。这些环境之间的联系是线性、有次序的。每个环境都可以向上搜索作用域链,以查询变量和函数名。但任何环境都不能通过向下搜索作用域链而进入另一个执行环境。对于swapColors(),其作用域链中包含3个对象:swapColors()的变量对象、changeColor()的变量对象和全局变量对象。swapColors()的局部环境开始时会先在自己的变量对象中搜索变量和函数名,如果搜索不到则再搜索上一级作用域链。changeColor()的作用域链中只包含两个对象:它自己的变量对象和全局变量对象。也就是说,它不能访问swapColors()的环境
函数参数也被当做变量来对待,因此其访问规则与执行环境中的其他变量相同。
4.2.1 延长作用域链
除了执行环境的两种类型:全局和局部(函数),还有一种来延长作用域链。有些语句在作用域链的前端临时增加一个变量对象,该变量对象会在代码执行后被移除。以下两种情况会发生,当执行流进入下列任何一个语句时,作用域链就会得到加长:
- try-catch语句的catch块;
- with语句;
这两个语句都会在作用域链的前端添加一个变量对象。对with语句来说,会将指定的对象添加到作用域链中。对catch语句来说,会创建一个新的变量对象,其中包含的是被抛出的错误对象的申明。举例如下:
function buildUrl() {
var qs = "?debug=true";
with(location) {
var url = href + qs;
}
return url;
}
在此,with语句接收的是location对象,因此其变量对象中就包含了location对象的所有属性和方法,而这个变量对象被添加到了作用域链的前端。buildUrl()函数中定义了一个变量qs。当在with语句中引用变量href时(实际引用的是location.href),可以在当前执行环境的变量对象中找到。当引用变量qs时,引用的则是在buildUrl()中定义的那个变量,而该变量位于函数环境的变量对象中。至于with语句内部,则定义了一个名为url的变量,因而url就成立函数执行环境的一部分,所以可以作为函数的值被返回。
在IE8及之前版本的JavaScript实现种,存在一个与标准不一致的地方,即在catch语句中捕获的错误对象会被添加到执行环境的变量对象,而不是catch语句的变量对象中。即,在catch块的外部也可以访问到错误对象。IE9修复了这个问题。
4.2.2 没有块级作用域
JavaScript没有块级作用域经常会导致理解上的困惑。在其他类C的语言中,由花括号封闭的代码块都有自己的作用域(用ECMAScript的话来讲,就是它们自己的执行环境),因而支持根据条件来定义变量。举例如下,不会得到想象中的结果:
if (true) {
var color = "blue";
}
alert(color); //blue
这里是在一个if语句中定义了变量color。如果在C、C++或Java中,color会在if语句执行完毕后被销毁。但在JavaScript中,if语句中的变量声明会将变量添加到当前的执行环境(在这里是全局环境)中。使用for语句时尤其要牢记这一差异。举例如下:
for (var i=0; i < 10; i++) {
doSomething(i);
}
alert(i); //10
对于有块级作用域的额语言来说,for语句初始化变量的表达式所定义的变量,只会存在于循环的环境之中。而对于JavaScript来说,由for语句创建的变量 i 即使在for循环执行结束后,也依旧会存在于循环外部的执行环境中。
1. 声明变量
使用var声明的变量会自动被添加到最接近的环境中。在函数内部,最接近的环境就是函数的局部环境;在with语句中,最接近的环境是函数环境。如果初始化变量时没有使用var声明,该变量会自动被添加到全局环境。举例如下:
function add(num1, num2) {
var sum = num1 + num2;
return sum;
}
var result = add(10, 20) //30
alert(sum); //由于sum不是有效的变量,因此会导致错误
以上代码中的sum在函数外部是访问不到的,但是如果省略其中的var关键字,那么当add()执行完毕后,sum也将可以访问到,因为这时sum成为被添加到全局环境中的变量。
在编写JavaScript代码的过程中,不声明而直接初始化变量是一个常见的错误做法,因为这样可能会导致意外。所以建议在初始化变量之前,一定要先声明,这样就可以避免类似问题。在严格模式下,初始化未经声明的变量会导致错误。
2.查询标识符
当在某个环节中为了读取或写入而引用一个标识符时,必须通过搜索来确定该标识符实际代表什么。搜索过程从作用域链的前端开始,向上逐级查询与给定名字匹配的标识符。如果在局部环境中找到了该标识符,搜索过程停止,变量就绪。如果在局部环境中没有找到该变量名,则继续沿作用域链向上搜索。搜索过程将一直追溯到全局环境的变量对象。如果在全局环境中也没有找到这个标识符,则意味着该变量尚未声明。
举例如下:
var color = "blue";
function getColor() {
return color;
}
alert(getColor()); //blue
调用函数getColor()时会引用变量color。为了确定变量color的值,首先搜索getColor()的变量对象,查找其中是否包含一个名为color的标识符。在没有找到的情况下,搜索继续到下一个变量对象(全局环境的变量对象),然后在哪里找到了名为color的标识符。因为搜索到了定义这个变量的变量对象,搜索结束。
在搜索过程中,如果存在一个局部的变量的定义,则搜索会自动停止,不再进入另一个变量对象。换句话说,如果局部环境中存在着同名标识符,就不会使用位于父环境中的标识符。举例如下:
var color = "blue";
function getColor() {
var color = "red";
return color;
}
alert(getColor()); //red
注意:任何位于局部变量color的声明之后的代码,如果不使用window.color都无法访问全局color变量。
变量查询也不是没有代价的。很明显,访问局部变量要比访问全局变量更快,因为不用向上搜索作用域链。
4.3 垃圾收集
JavaScript具有自动垃圾收集机制,即,执行环境会负责管理代码执行过程中使用的内存。而在C和C++之类的语言中,开发人员的一项基本任务就是手工跟踪内存的使用情况,这是造成许多问题的一个根源。在编写JavaScript程序时,开发人员不用再关系内存使用问题,所需内存的分配以及无用内存的回收完全实现了自动管理。原理:找出那些不再继续使用的变量,然后释放其占用的内存。为此,垃圾收集器会按照固定的时间间隔(或代码执行中预定的收集时间),周期性地执行这一操作。
分析函数中局部变量的正常生命周期。局部变量只在函数执行的过程中存在。而在这个过程中,会为局部变量在栈(或堆)内存上分配相应的空间,以便存储它们的值。然后在函数中使用这些变量,直至函数执行结束。此时,局部变量就没有存在的必要了,因此可以释放它们的内存以供将来使用。在这种情况下,很容易判断变量是否还有存在的必要,因此可以释放它们的内存以供将来使用。在这种情况下,很容易判断变量是否还有存在的必要,但并非所有情况下都这么容易就能得出结论。垃圾收集器必须跟踪哪个变量有用哪个变量没用,对于不再有用的变量打上标记,以备将来收回其占用的内存。用于标识无用变量的策略可能会因实现而异,但具体到浏览器中的实现,则通常有两个策略。
4.3.1 标记清除
JavaScript中最常用的垃圾收集方式是标记清除(mark-and-sweep)。当变量进入环境(例如,在函数中声明一个变量)时,就将这个变量标记为“进入环境”。从逻辑上讲,永远不能释放进入环境的变量所占用的内存,因为只要执行流进入相应的环境,就可能会用到它们。而当变量离开环境时,则将其标记为“离开环境”。
可以使用任何方式来标记变量。比如,可以通过反转某个特殊的位来记录一个变量何时进入环境,或者使用一个“进入环境的”变量列表及一个“离开环境的”变量列表来跟踪哪个变量发生了变化。说到底,如何标记变量其实并不重要,关键在于采取什么策略。
垃圾收集器在运行时候会给存储在内存中的所有变量都加上标记(当然,可以使用任何标记方式)。然后,它会去掉环境中的变量以及被环境中的变量引用的变量的标记。而在此之后再被加上标记的变量将被视为准备删除的变量,原因是环境中的变量已经无法访问到这些变量了。最后,垃圾收集器完成内存清除工作,销毁那些带标记的值并回收它们所占用的内存空间。
到2008年,IE、Firefox、Opera、Chrome和Safari的JavaScript实现使用的都是标记清除式的垃圾收集策略,只不过时间间隔互有不同。
4.3.2 引用计数
引用计数(reference counting)是另一种不太常见的垃圾收集策略。跟踪每个值的被引用次数。当声明了一个变量并将一个引用类型值赋给该变量时,则这个值的引用次数就是1。如果同一个值又被赋给另一个变量,这该值的引用次数加1.箱单,如果包含对这个值引用的变量又取得了另外一个值,则这个值的引用次数减1。当这个值的引用次数变成0时,则说明没有办法再访问这个值了,因而就可以将其占用的内存空间回收回来。这样,当垃圾收集器下次再运行时,它就会释放那些引用次数为零的值所占用的内存。
引用计数会有一个循环引用的问题。当对象A中包含一个指向对象B的指针,而对象B中也包含一个指向对象A的引用。那么他们的引用次数永远不会是0。假如这个函数被重复多次调用,就会导致大量内存得不到回收。
将变量设置为null意味着切断变量与它此前引用的值之间的连接。当垃圾收集器下次运行时,就会删除这些值并回收它们占用的内存。
4.3.3 性能问题
垃圾收集器是周期性运行的,而且如果为变量分配的内存数量很可观,那么回收工作量也是相当大的。
略。
4.3.4 管理内存
分配给Web浏览器的可用内存数量通常要比分配给桌面应用程序的少。为了确保占用最少的内存可用让页面获得更好的性能。优化内存占用的最佳方式,就是为执行中的代码只保存必要的数据。一旦数据不再可用,最好通过将其值设置为null来释放其引用–这个做法叫做解除引用(dereferencing)。这一做法适用于大多数全局变量和全局对象的书写。局部变量会在它们离开执行环境时自动被解除引用,举例如下:
function createPerson(name) {
var localPerson = new Object();
localPerson.name = name;
return localPerson;
}
var globalPerson = createPerson("Nicholas");
//手工解除globalPerson的引用
globalPerson = null;
在这个例子中,变量globalPerson取得了createPerson()函数返回值。在createPerson()函数内部,我们创建了一个对象并将其赋给局部变量localPerson,然后又为该对象添加了一个名为name的属性。最后,当调用这个函数时,localPerson以函数值的形式返回并赋给全局变量globalPerson。由于localPerson在createPerson()函数执行完毕后就离开了其执行环境,因此无需我们显示地去为它解除引用。但是对于全局变量globalPerson而言,则需要我们在不使用它的时候手工为它解除引用。
解除一个值的引用并不意味着自动回收该值所占用的内存。解除引用的真正作用是让值脱离执行环境,以便垃圾收集器下次运行时将其回收。
4.4 小结
JavaScript变量可以用来保存两种值:基本类型值和引用类型值。特点:
- 基本类型值在内存中占据固定大小的空间,因此被保存在栈内存中;
- 从一个变量向另一个变量复制基本类型的值,会创建这个值的副本;
- 引用类型的值是对象,保存在栈内存中;
- 包含引用类型值的变量实际上包含的并不是对象本身,而是一个指向该对象的指针;
- 从一个变量向另一个变量复制引用类型的值,复制的其实是指针,因此两个变量最终都指向同一个对象;
- 确定一个值是那种基本类型可以使用typeof操作符,而确定一个值是哪种引用类型可以使用instanceof操作符;
所有变量都存在于一个执行环境(作用域)中,执行环境决定了变量的生命周期,以及哪一部分代码可以访问其中的变量。总结如下:
- 执行环境分全局执行环境和函数执行环境;
- 每次进入一个新执行环境,都会创建一个用于搜索变量和函数的作用域链;
- 函数的局部环境不仅有权访问函数作用域中的变量,而且有权访问其包含(父)环境,乃至全局环境;
- 全局环境只能访问在全局环境中定义的变量和函数,而不能直接访问局部环境中的任何数据;
- 变量的执行环境有助于确定应该何时释放内存。
JavaScript的自动垃圾收集机制:
- 离开作用域的值将被自动标记为可以回收,因此将在垃圾收集期间被删除;
- “标记清除”是目前主流的垃圾收集算法,给当前不使用的值加上标记,然后再回收期内存。
- “引用计数”,跟踪记录所有值被引用的次数。JavaScript引擎目前都不再使用这种算法;但IE访问非原生JavaScript对象(如DOM元素)时,这种算法仍然可能会导致问题;
- 当代码中存在循环引用现象时,“引用计数”算法会导致问题;
- 解除变量的引用不仅有助于消除循环引用现象,而且对垃圾收集也有好处。为了确保有效地回收内存,应该及时解除不再使用的全局对象、全局对象属性以及循环引用变量的引用。