GBK和UTF-8概述:
UTF-8(8位Unicode转换格式):是一种用于编码各种字符的相对较新的代码约定。它是字符标识的标准,也是各种编程语言和设备的参考,有助于标准化字母,数字和其他字符的显示。UTF-8也称为RFC 2279。
GBK:GBK即汉字内码扩展规范,K为扩展的汉语拼音中"扩"字的声母。英文全称Chinese Internal Code Specification。GBK编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集–基本集》,1980年由国家标准总局发布。基本集共收入汉字6763个和非汉字图形字符682个,通行于中国大陆。
简单的概况就是:
UTF-8英文1字节中文3字节,在编码效率和编码安全性之间做了平衡,适合网络传输,是理想的中文编码方式。
GBK英文1字节(半角1字节,全角2字节),中文2字节,GBK的范围比GB2312广,GBK兼容GB2312
GBK和UTF-8在数据库中的测试:
MySQL测试:
GBK编码:
代码示例:
-- 创建指定GBK编码的表
CREATE TABLE gbk (fstr VARCHAR(2), fchr CHAR(2)) DEFAULT CHARSET=GBK