关于编码问题:
早期编码是ascii编码,英文中一般只有26个字母还有各种特殊符号,所以ascii编码表使用一个字节大小(256种可能,足够来表示英语中各种字符字符)来存储英文字符跟1-256之间的对应关系。那么中文该怎么样表示呢?那么unicode就解决了这个问题:一个中文可以用两个英文字符来表示,最后存储时再将这两个英文字符转换成ascii码值来存储,一般两个英文字符可以有256*256=65536种可能,已经涵盖了绝大多数汉字,一些生僻字可以特殊的使用3个英文字符来表示。
关于编码问题:
早期编码是ascii编码,英文中一般只有26个字母还有各种特殊符号,所以ascii编码表使用一个字节大小(256种可能,足够来表示英语中各种字符字符)来存储英文字符跟1-256之间的对应关系。那么中文该怎么样表示呢?那么unicode就解决了这个问题:一个中文可以用两个英文字符来表示,最后存储时再将这两个英文字符转换成ascii码值来存储,一般两个英文字符可以有256*256=65536种可能,已经涵盖了绝大多数汉字,一些生僻字可以特殊的使用3个英文字符来表示。