UTF-8是一种国际化标准的文字编码,我们已知Windows系统程序已经将最初的UTF-8转向Unicode,而GBK的存在是为了中国国情而创造的,不过GBK也将伴随着中文字符的一直流传下去。
简单而言:
GBK: 专门用来解决中文编码,双字节。
是在国家标准GB2312基础上扩容后兼容GB2312标准。
包含全部中文字符。
UTF-8: 解决国际上制度的一种多字节编码,对英文使用8位(1个字节),中文使用24位(3个字节)来编码。
对于英文字符较多的论坛适用于UTF-8节省空间。
包含全世界所有国家需要用到的字符。
GBK和UTF-8文字编码的特点:
GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。
至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。