编程语言的词法结构是一套基础性规则,用来描述如何使用这门语言来编写程序。作为语法的基础,它规定了诸如变量名,注释,以及程序语句之间如何分隔等规则。
2.1 字符集
JavaScript程序是用Unicode字符集编写的。Unicode是ASCII和Lation-1的超集,并支持地球上几乎所有在用的语言。ECMAScript3要求JavaScript的现实必须支持Unicode2.1及后续版本,ECMAScript5则要求支持Unicode3及后续版本。
2.1.1 区分大小写
JavaScript是区分大小写的语言。但是需要注意的是,HTML并不区分大小写(尽管XHTML区分大小写)。
2.1.2 空格、换行符和格式控制符
多数情况下,JavaScript会忽略程序中标识之间的空格。由于可以在代码中随意使用空格和换行,因此可以采用整齐、一致的缩进来形成统一的编码风格,从而提高代码的可读性。
JavaScript会忽略程序中标识(token)之间的空格。多数情况下会忽略换行符。由于可以在代码中随意使用空格和换行,因此可以采用整齐、一致的缩进来形成统一的编码风格,从而提高代码的可读性。
除了可以识别普通的\0u0020 空格 还可以识别如下这些表示空格的字符:\u0009 水平制表符 \u000B 垂直制表符 \u000C 换页符 \u00A0 不中断空白 \uFEFF 字节序标记 以及在Unicode中所有Zs类别(即是其中一种类别值,特指没有标志符号但不属于控制或格式字符的空格字符。更多类别值的描述请参见http://www.unicode.org/report