Unicode:ISO(国际标准化组织)为了解决不同语言之间进行文本转换和处理,为每种语言设置统一的唯一的二进制标准。(简称UCS)。Unicode只是规定如何编码,并没有规定如何传输和保存编码。
UTF-8及UTF系列:兼容全世界各种语言字符。UTF-8英文只占一个字节,汉字占3个字节。
GB2312是对ASCII码的中文扩展,使用2个字节编码。
GBK是在GB2312基础上的扩容,兼容GB2312,添加了繁体字表示。
UTF-8和GBK优缺点:
UTF-8具有良好的国际语言兼容性。英文字符只占1个字节,但是汉字占用了3个字节并且占用数据库存储空间过多。GBK汉字只占用了2个字节,如果不考虑国际化,使用GBK编码执行效率会更高。