一、字符集和字符编码
首先,字符编码和字符集是两个不一样的概念。我们平时常说gb2312编码,但事实上gb2312是一个字符集,在这个字符集中,每一个字符都对应两个字节的编码。但如果我们打开一个gb2312编码的文件,我们会发现,在这个文件中,某些字符是1个字节保存的,某些字符是2个字节保存的。也就是说,存储时的编码不是完全按照字符集中的编码来做的。这个过程中包含了一个映射关系。
gb2312字符集可以在http://www.knowsky.com/resource/gb2312tbl.htm查看到。
在Windows下打开记事本程序,输入一段中英文混杂的文字,保存,然后查看此文件的二进制表示,再对照上面网址提供的gb2312编码表,就会理解上面说的意思了。