字符集编码发展到今天,其实经历了一个漫长而曲折的过程。从开始的ASCII,到后来的ANSI,再到现在的UNICODE。
计算机是由发达资本主义国家发明的,而这些国家基本都是英语国家,用8位(256中状态)足以表示他们使用的所有符号(字母、数字、标点符号、控制字符等),而且还用不完(只用了前127号),所以他们最终决定一个字节由8位(即8个晶体管)组成。每个字节表示一个具体的符号,然后将这些符号连起来就能表示世间万物了。这种编码就是大名鼎鼎的ASCII(American Standard Code forInformation Interchange,美国信息交换标准码)码。
ASCII就是我们常说的SBCS(single-bye charater set,单字节字符集)。
刚开始只用了0x00-0x7f(127个字符状态),后来又有新的语言国家使用了计算机,这些国家便对127号以后的空位打起了注意,并最终将256个字符全部用掉,0x80-0xff(127号以后)为扩展字符集。至此人类再也没有可用的字节了。当计算机来到中国的时候,已经没有可用的字节状态来表示汉子了。讲到这里我想起了一手好玩的诗,大体内容是这样的:
上帝创造了这个世界,
可这个世界一片漆黑。
然后上帝又创造了牛顿,
将这个世界变得一片光明。
后来上帝又创造了爱因斯坦,
又将这个世界拉回到了黑暗中。
哈哈,有意思吧。我觉得中国就是爱因斯坦,将计算机的国际化推入了火坑之中。但勤劳而富有创造力的中国人民坚信&#x