目前,ECMA-262第3版中定义的ECMAScript是各浏览器实现最多的一个版本。ECMA-262第4版引入了新的语法、操作符、对象和动态修改 JavaScript 运行方式的概念。考虑到各浏览器对第4版的支持还很不充分,本章将完全按照第3版定义的 ECMAScript 介绍这门语言的基本概念。
3.1 语法
ECMAScript 的语法大量借鉴了 C 及其他类 C 语言 (如 Java 和 Perl) 的语法。
3.1.1 区分大小写
要理解的第一个概念就是 ECMAScript 中的一切 -- 变量、函数名和操作符 -- 都区分大小写。这也就意味着,变量名 test 和变量名 Test 分别表示两个不同的变量,而函数名不能使用 typeof ,因为它是一个关键字,但 typeOf 则完全可以是一个有效的函数名。
3.1.2 标识符
所谓标识符,就是指变量、函数、属性的名字,或者函数的参数。标识符可以是按照下列格式规则组合起来的一或多个字符:
- 第一个字符必须是一个字母、下划线 ( _ ) 或一个美元符合 ( $ ) ;
- 其他字符可以是字母、下划线、美元符合或数字。
3.1.4 语句
3.2 关键字和保留字
3.3 变量
3.4 数据类型
3.4.1 typeof 操作符
- "underfined" -- 如果这个值未定义;
- "boolean" -- 如果这个值是布尔值;
- "string" -- 如果这个值是字符串;
- "number" -- 如果这个值是数值;
- “object” -- 如果这个值是对象或null;
- "function" -- 如果这个值是函数。
3.4.2 Undefined 类型
alert(typeof age); // "undefined"
结果表明,对未初始化和未声明的变量执行 typeof 操作符都返回了 undefined 值;这个结果有其逻辑上的合理性。因为虽然这两种变量从技术角度看有本质区别,但实际上无论对哪种变量也不可能执行真正的操作。
即便未初始化的变量会自动被赋予 undefined 值,但显示地初始化变量依然是明智的选择。如果能够做到这一点,那么当 typeof 操作符返回 undefined 值时,我们就知道被检测的变量还没有被声明,而不是尚未初始化。
3.4.4 Null类型
Null 类型是第二个只有一个值的数据类型,这个特殊的值是 null 。从逻辑角度来看,null 值表示一个空对象指针,而这也正是使用 typeof 操作符检测 null 值时会返回 "object" 的原因,如下面的例子所示:
var car = null;
alert(typeof car); // "object"
如果定义的变量准备在将来用于保存对象,那么最好将该变量初始化为 null 而不是其他值。这样一来,只要直接检查 null 值就可以知道相应的变量是否已经保存了一个对象的引用了,如下面例子所示:
if (car != null) {
// 对 car 对象执行某些操作
}
实际上,undefined 值是派生自 null 值的,因此 ECMA-262 规定对它们相等性测试要返回 true:
alert(null == undefined); // true
这里,位于 null 和 undefined 之间的相等操作符 ( == ) 总是返回 true ,不过要注意的是,这个操作符出于比较的目的会转换其他操作数。
尽管 null 和 undefined 有这样的关系,但它们的用途完全不同。如前所述,无论在什么情况下都没有必要把一个变量的值显式地设置为 undefined ,可是同样的规则对 null 却不适用。换句话说,只要意在保存对象的变量还没有真正保存对象,就应该明确地让该变量保存 null 值。这样做不仅可以体现 null 作为空对象指针的惯例,而且也有助于进一步区分 null 和 undefined 。
3.4.4 Boolean 类型
Boolean类型是 ECMAScript 中使用得最多的一种类型,该类型只有两个字面值: true 和 false 。这两个值与数字值不是一回事,因此 true 不一定等于 1 ,而 false 也不一定等于 0 。以下是为变量赋 Boolean 类型值的例子:
var found = true;
var lost = false;
需要注意的是,Boolean 类型的字面值 true 和 false 是区分大小写的。也就是说, True 和 False (以及其他的混合大小写形式) 都不是 Boolean 值,只是标识符。
虽然 Boolean 类型的字面值只有两个,但 ECMAScript 中所有类型的值都有与这两个 Boolean 值等价的值。要将一个值转换为其对应的 Boolean 值,可以调用转型函数 Boolean() ,如下例所示:
var message = "Hello world!";
var messageAsBoolean = Boolean(message);
在这个例子中,字符串 message 被转换成了一个 Boolean 值,该值被保存在 messageAsBoolean 变量中。可以对任何数据类型的值调用 Boolean() 函数,而且总会返回一个 Boolean 值。至于返回的这个值是 true 还是 false ,取决于要转换值的数据类型及其实际值。下表给出了各种数据类型及其对应的转换规则。
这些转换规则对理解流控制语句 (如 if 语句) 自动执行相应的 Boolean 转换非常重要,请看下面的代码:
var message = "Hello world!";
if (message){
alert("Value is true");
}
运行这个示例,就会显示一个警告框,因为字符串 message 被自动转换成了对应的 Boolean 值(true) 。由于存在这种自动执行的 Boolean 转换,因此确切地知道在流控制语句中使用的是什么变量至关重要。错误地使用一个对象而不是一个 Boolean 值,就有可能彻底改变应用程序的流程。
3.4.5 Number 类型
Number 类型应该是 ECMAScript 中最令人关注的数据类型了,这种类型使用 IEEE754 格式来表示整数和浮点数值 (浮点数值在某些语言中也被称为双精度数值)。为支持各种数值类型,ECMA-262 定义了不同的数值字面量格式。
最基本的数值字面量格式是十进制整数,十进制整数可以像下面这样直接在代码中输入:
var intNum = 55; // 整数
除了以十进制表示外,整数还可以通过八进制 (以8为基数) 或十六进制 (以16为基数) 字面值来表示。其中,八进制字面值的第一位必须是零 (0) ,然后是八进制数字序列 (0 - 7) 。如果字面值中的数值超出了范围,那么前导零将被忽略,后面的数值将被当作十进制数值解析。请看下面的例子:
var octalNum1 = 070; // 八进制的 56
var octalNum2 = 079; // 无效的八进制数值 -- 解析为79
var 0ctalNum3 = 08; // 无效的八进制数值 -- 解析为 8
十六进制字面值的前两位必须是 0x ,后面跟任何十六进制数字 (0 - 9 及 A - F) 。其中,字母 A - F 可以大写,也可以小写。如下面的例子所示:
var hexNum1 = 0xA; // 十六进制的 10
var hexNum2 = 0x1f // 十六进制的 31
虽然数值可以用八进制或十六进制来表示,但在进行算术计算时,所有以八进制和十六进制表示的数值最终都将被转换成十进制数值。
3.NaN
NaN,即非数值 (Not a Number) 是一个特殊的数值,这个数值用于表示一个本来要返回数值的操作数未返回数值的情况(这样就不会抛出错误了)。例如,在其他编程语言中,任何数除以 0 都会导致错误,从而停止代码执行。但在 ECMAScript 中,任何数值除以 0 会返回 NaN ,因此不会影响其他代码的执行。
NaN本身有两个非同寻常的特点。首先,任何涉及NaN的操作 (例如 NaN/10) 都会返回 NaN ,这个特点在多步计算中有可能导致问题。其次,NaN与任何值都不相等,包括 NaN 本身。例如,下面的代码会返回 false :
alert(NaN == NaN); // false
针对NaN的这两个特点,ECMAScript 定义了 isNaN() 函数。这个函数接受一个参数,该参数可以是任何类型,而函数会帮我们确定这个参数是否 "不是数值" 。isNaN() 在接收到一个值之后,会尝试将这个值转换为数值。某些不是数值的值会直接转换为数值,例如字符串 "10" 或 Boolean 值 。而任何不能被转换为数值的值都会导致这个函数返回 true 。请看下面的例子:
alert(isNaN(NaN)); // true
alert(isNaN(10)); // false (10 是一个数值)
alert(isNaN("10")); // false (可以被转换成数值 10)
alert(isNaN("blue")); // true (不能转换成数值)
alert(isNaN(true)); // false (可以被转换成数值 1)
尽管有点不可思议,但 isNaN() 确实也适用于对象。在基于对象调用 isNaN()函数时,会首先调用对象的 valueOf() 方法,然后确定该方法返回的值是否可以转换为数值。如果不能,则基于这个返回值再调用 toString() 方法,再测试返回值。而这个过程也是 ECMAScript 中内置函数和操作符的一般执行流程。
4.数值转换
有3个函数可以把非数值转换为数值:Number()、parseInt()和parseFloat()。第一个函数,即转型函数 Number() 可以用于任何数据类型,而另两个函数则专门用于把字符串转换成数值。这3个函数对于同样的输入会有返回不同的结果。
根据这么多的规则使用 Number() 把各种数据类型转换为数值确实有点复杂。下面还是给出几个具体的例子吧:
var num1 = Number("Hello world!"); // NaN
var num2 = Number(""); // 0
var num3 = Number("000011"); // 11
var num4 = Number(true); // 1
由于 Number() 函数在转换字符串时比较复杂而且不够合理,因此在处理整数的时候更常用的是 parseInt() 函数。parseInt() 函数在转换字符串时,更多的是看其是否符合数值模式。它会忽略字符串前面的空格,直至找到第一个非空格字符。如果第一个字符不是数字字符或者负号,parseInt() 就会返回 NaN ;也就是说,用 parseInt() 转换空字符串会返回 NaN (Number()对空字符返回0) 。如果第一个字符是数字字符,parseInt()会继续解析第二个字符,直到解析完所有后续字符或者遇到了一个非数字字符。例如,"1234blue" 会被转换为 1234,因为 "blue" 会被完全忽略。类似地,"22.5" 会被转换为 22,因为小数点并不是有效的数字字符。
如果字符串中的第一个字符是数字字符,parseInt()也能够识别出各种整数格式(即前面讨论的十进制、八进制和十六进制数)。也就是说,如果字符串以 "0x" 开头且后跟数字字符,就会将其当作一个十六进制整数;如果字符串以 "0" 开头且后跟数字字符,则会将其当作一个八进制数来解析。
为了更好地理解 parseInt() 函数的转换规则,下面给出一些例子:
var num1 = parseInt("1234blue"); // 1234
var num2 = parseInt(""); // NaN
var num3 = parseInt("0xA"); // 10(十六进制数)
var num4 = parseInt(22.5); // 22
var num5 = parseInt("070"); // 56(八进制数)
var num6 = parseInt("70"); // 70(十进制数)
var num7 = parseInt("0xf"); // 15(十六进制数)
理解这几个例子时,最关键的是要注意 parseInt() 解析 "070" 和 "70" 的不同方式。此时 "070" 中的前导零表示这是一个八进制 (而非十进制) 格式的字符串,因而结果是 56(注意这个结果与调用 Number()函数不同)。而 "70" 呢,由于它没有前导的零,因此就被转换成了 70 。为了消除在使用 parseInt() 函数时可能导致的上述困惑,ECMAScript 也为函数提供了第二个参数:转换时使用的基数 (即多少进制)。
如果知道要解析的值是十六进制格式的字符串,那么指定基数 16 作为第二个参数,可以保证得到正确的结果,例如:
var num = parseInt("0xAF", 16); // 175
实际上,如果指定了 16 作为第二个参数,字符串可以不带前面的 "0x" ,如下所示:
var num1 = parseInt("AF", 16); // 175
var num2 = parseInt("AF"); // NaN
指定基数会影响到转换的输出结果。例如:
var num1 = parseInt("10", 2); // 2 (按二进制解析)
var num2 = parseInt("10", 8); // 8 (按八进制解析)
var num3 = parseInt("10", 10); // 10 (按十进制解析)
var num4 = parseInt("10", 16); // 16 (按十六进制解析)
与 parseInt() 函数类似,parseFloat() 也是从第一个字符 (位置 0) 开始解析每个字符。而且也是一直解析到字符串末尾,或者解析到遇见一个无效的浮点数字字符为止。也就是说,字符串中的第一个小数点是有效的,而第二个小数点就是无效的了,因此它后面的字符串将被忽略。
除了第一个小数点有效之外,parseFloat() 与 parseInt() 的第二个区别在于它始终都会忽略前导的零。parseFloat() 可以识别前面讨论过的所有浮点数值格式,也包括十进制整数格式。但十六进制格式的字符串则始终会被转换成0 。由于 parseFloat() 只解析十进制值,因此它没有用第二个参数指定基数的用法。最后还要注意一点:如果字符串包含的是一个可解析为整数的数 (没有小数点,或者小数点后都是零) ,parseFloat() 会返回整数。以下是使用 parseFloat() 转换数值的几个典型示例:
var num1 = parseFloat("1234blue"); // 1234 (整数)
var num2 = parseFloat("0xA"); // 0
var num3 = parseFloat("22.5"); // 22.5
var num4 = parseFloat("22.34.5"); // 22.34
var num5 = parseFloat("0908.5"); // 908.5
var num6 = parseFloat("3.125e7"); // 31250000
3.4.6 String 类型
String 类型用于表示由零或多个16位 Unicode 字符组成的字符序列,即字符串。字符串可以由双引号(")或单引号(')表示。
1.字符字面量
String 数据类型包含一些特殊的字符字面量,也叫转义序列,用于表示非打印字符,或者具有其他用途的字符。这些字符字面量如下表所示:
这些字符字面量可以出现在字符串中的任意位置,而且也将被作为一个字符来解析,如下面的例子所示:
var text = "This is the letter sigma: \u03a3." ;
这个例子中的变量 text 有 28 个字符,其中 6 个字符长的转义序列表示 1 个字符。
任何字符串的长度都可以通过访问其 length 属性取得,例如:
alert(text.length); // 输出 28
这个属性返回了这个字符串中 16 位字符的数目。如果字符串中包含双字节字符,那么 length 属性可能不会精确地返回字符串中的字符数目。
2.字符串的特点
ECMAScript 中的字符串是不可变的,也就是说,字符串一旦创建,它们的值就不能改变。要改变某个变量保存的字符串,首先要销毁原来的字符串,然后再用另一个包含新值的字符串填充该变量,例如:
var lang = "Java";
lang = lang + "Script";
以上示例中的变量 lang 开始时包含字符串 "Java" 。而第二行代码把 lang 的值重新定义为 “Java” 与 “Script” 的组合,即 “JavaScript” 。实现这个操作的过程如下:首先创建一个能容纳 10 个字符的新字符串,然后在这个字符串中填充 “Java” 和 “Script” ,最后一步是销毁原来的字符串 "Java" 和字符串 "Script" ,因为这两个字符串已经没用了。这个过程是在后台发生的,而这也是在某些旧版本的浏览器 (例如版本低于 1.0 的 Firefox、IE6 等) 中拼接字符串时速度很慢的原因所在。但这些浏览器后来的版本已经解决了这个低效率问题。
3.转换为字符串
要把一个值转换为一个字符串有两种方式。第一种是使用几乎每个值都有的 toString() 方法。这个方法唯一要做的就是返回相应值的字符串表现。来看下面的例子:
var age = 11;
var ageAsString = age.toString(); // 字符串 "11"
var found = true;
var foundAsString = found.toString(); // 字符串 "true"
数值、布尔值、对象和字符串值 (没错,每个字符串也都有一个 toString() 方法,该方法返回字符串的一个副本) 都有 toString() 方法。但 null 和 undefined 值没有这个方法。
多数情况下,调用 toString() 方法不必传递参数。但是,在调用数值的 toString() 方法时,可以传递一个参数:输出数值的基数。默认情况下,toString() 方法以十进制格式返回数值的字符串表示。而通过传递基数,toString() 可以输出以二进制、八进制、十六进制,乃至其他任意有效进制格式表示的字符串值。下面给出几个例子:
var num = 10;
alert(num.toString()); // "10"
alert(num.toString(2)); // "1010";
alert(num.toString(8)); // "12"
alert(num.toString(10)); // "10"
alert(num.toString(16)); // "a"
在不知道要转换的值是不是 null 或 undefined 的情况下,还可以使用转型函数 String() ,这个函数能够将任何类型的值转换为字符串。String() 函数遵循下列转换规则:
- 如果值有 toString() 方法,则调用该方法 (没有参数) 并返回相应的结果;
- 如果值是 null,则返回 "null"
- 如果是 undefined ,则返回 "undefined" 。
3.4.7 Object 类型
- constructor -- 保存着用于创建当前对象的函数。对于前面的例子而言,构造函数 (constructor) 就是 Object();
- hasOwnProperty (propertyName) -- 用于检查给定的属性在当前对象实例中 (而不是在实例的原型中) 是否存在。其中,作为参数的属性名 (propertyName) 必须以字符串形式指定 (例如: o.hasOwnProperty("name"));
- isPrototypeOf (object) -- 用于检查传入的对象是否是另一个对象的原型;
- propertyIsEnumerable (propertyName) -- 用于检查给定的属性是否能够使用 for-in 语句来枚举。与 hasOwnProperty() 方法一样,作为参数的属性名必须以字符串形式指定;
- toString() -- 返回对象的字符串表示;
- valueOf() -- 返回对象的字符串、数值或布尔值表示。通常与 toString() 方法的返回值相同。