无论历史上的UCS还是现如今的Unicode,两者指的都是编码字符集,而不是字符集编码。
一个抽象字符集其实就是指字符的集合,例如所有的英文字母是一个抽象字符集,所有的汉字是一个抽象字符集,
在给一个抽象字符集合中的每个字符都分配一个 整数编号之后(注意这个整数并没有要求大小),这个字符集就有了顺序,就成为了编码字符集。同时,通过这个编号,可以唯一确定到底指的是哪一个字符。当 然,对于同一个字符,不同的字符集编码系统所制定的整数编号也不尽相同。
我们常说的Unicode字符集,指的就是这种被分配了整数编号的字符集合,但要澄清的是,编码 字符集中字符被分配的整数编号,不一定就是该字符在计算机中存储时所使用的值,计算机中存储的字符到底使用什么二进制整数值来表示,是由下面将要说到的字符集编码决定的。
字符集编码决定了如何将一个字符的整数编号对应到一个二进制的整数值。