全面了解javascript笔记(一)

最新推荐文章于 2024-09-11 14:28:07 发布

xujiaxuliang

最新推荐文章于 2024-09-11 14:28:07 发布

阅读量1k

点赞数

分类专栏： UED_前端开发文章标签： javascript character xhtml 语言 encoding html

本文链接：https://blog.csdn.net/xujiaxuliang/article/details/5960954

版权

UED_前端开发专栏收录该内容

16 篇文章 0 订阅

订阅专栏

一、ＪＳ的词法结构

1、js程序的文本编码

　ECMAScript V3规范使用16位的unicode,即/u****表示。

　与javascript版本的区别：ECMAScript V2/ V1, 或　ECMA标准之前的js版本；

2、大小写敏感

注意区别HTML 和XHTML的规范　

3、行末分号可选，但应该习惯规范加上分号

因为会造成异常：　１）　return　true 之间换行　　2) break labelName 之间换行

4、注释：　//　　或　/**/　,　最好使用//

5、直接量　

6、标识符：　

命名规则:第一个字符必须是字母、_或$,　且不要是保留字，　和浏览器已定义的全局变量　如window

补充知识：

1.1、所有的文本字符集介绍与理解：

字符(Character)是文字与符号的总称，包括文字、图形符号、数学符号等。

　需要将字符和二进制内码对应起来，这种对应关系就是字符编码(Encoding)

　制定编码首先要确定字符集，并将字符集内的字符排序，然后和二进制数字对应起来。根据字符集内字符的多少，会确定用几个字节来编码。

　那么有哪些字符集：

1)、ASCII : 目前计算机中用得最广泛的字符集及其编码，由美国国家标准局(ANSI )制定。它已被国际标准化组织(ISO)定为国际标准，称为ISO 646 标准。一个ASCII码值占一个字节(8个二进制位)，其最高位(b7)用作奇偶校验位

2)、ISO 8859-1 : 与ASCII类似，也是单字节的大小。但已分化出15种西欧的语言字符集，ISO 8859-1　--　ISO 8859-16 ；

很明显，iso8859-1编码表示的字符范围很窄，无法表示中文字符。但是，由于是单字节编码，和计算机最基础的表示单位一致，所以很多时候，仍旧使用iso8859-1编码来表示。而且在很多协议上，默认使用该编码。

3)、GB2312/GBK

这就是汉子的国标码，专门用来表示汉字，是双字节编码，而英文字母和iso8859-1一致（兼容iso8859-1编码）。其中gbk编码能够用来同时表示繁体字和简体字，而gb2312只能表示简体字，gbk是兼容gb2312编码的。

4)、unicode

这是最统一的编码，可以用来表示所有语言的字符，而且是定长双字节（也有四字节的）编码，包括英文字母在内。所以可以说它是不兼容iso8859-1编码的，也不兼容任何编码。不过，相对于iso8859-1编码来说，uniocode编码只是在前面增加了一个0字节，比如字母'a'为"00 61 "。

需要说明的是，定长编码便于计算机处理（注意GB2312/GBK不是定长编码），而unicode又可以用来表示所有字符，所以在很多软件内部是使用unicode编码来处理的，比如java。

5)、UTF

考虑到unicode编码不兼容 iso8859-1编码，而且容易占用更多的空间：因为对于英文字母，unicode也需要两个字节来表示。所以unicode不便于传输和存储。因此而产生了utf编码，utf编码兼容iso8859-1编码，同时也可以用来表示所有语言的字符，不过，utf编码是不定长编码，每一个字符的长度从1-6 个字节不等。另外，utf编码自带简单的校验功能。一般来讲，英文字母都是用一个字节表示，而汉字使用三个字节。

注意，虽然说utf是为了使用更少的空间而使用的，但那只是相对于unicode编码来说，如果已经知道是汉字，则使用GB2312/GBK无疑是最节省的。不过另一方面，值得说明的是，虽然utf编码对汉字使用3个字节，但即使对于汉字网页，utf编码也会比unicode编码节省，因为网页中包含了很多的英文字符。

问题理解 :
我们在Windows系统中保存文本文件时通常可以选择编码为ANSI、Unicode、Unicode big endian和UTF-8，这里的ANSI是什么编码呢?
ANSI:
使用2个字节来代表一个字符的各种汉字延伸编码方式，称为ANSI编码。
在简体中文系统下，ANSI编码代表GB2312编码，在日文操作系统下，ANSI编码代表JIS编码。

为什么会乱码?
乱码是个老问题，从上面我们知道，字符在保存时的编码格式如果和要显示的编码格式不一样的话，就会出现乱码问题。
我们的Web系统，从底层数据库编码、Web应用程序编码到HTML页面编码，如果有一项不一致的话，就会出现乱码。
所以，解决乱码问题说难也难说简单也简单，关键是让交互系统之间编码一致。

1.2、js对程序内部字符串的编码函数：

　暂略～