GBK与UTF-8的区别:
- GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准。GBK编码专门用来解决中文编码的,是双字节的。不论中英文都是双字节的。支持持简体中文。
- UTF-8 编码是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。
- 如果是外国人访问GBK的系统,需要下载中文语言包支持。
- GBK包含全部中文字符(含生僻字);UTF-8则包含全世界所有国家需要用到的字符。
- 如果主要做中文程序的开发,客户也主要是中国用户的话就用GBK,因为UTF-8编码的中文使用了三个字节,用GBK节省了空间(两字节)。
GBK改造成UTF-8的风险:
- 最早使用GB2312,历史上遇到过中文生僻字乱码的问题(主要是客户姓名,起名字时为了一些好彩头会选一些生僻汉字),后改为GBK才完整兼容。
- 如果改造成UTF-8,各业务环节都要做中文及生僻字的回归测试,测试成本较高。
- 我们还是推荐客户安装中文语言包的支持,目前外资客户,都选择安装了中文语言包。