GBK、GB2312都是编码方式,都是双字节字符集,GB18030编码是一二四字节变长编码
GB:国标,国家标准
BIG5:
支持繁体中文
GB2312:
支持简体中文(GBK的子集)
共收录 6763 个汉字
GBK:
支持简体、繁体中文,比GB2312收录更多汉字(GB18030的子集)
GBK 即汉字内码扩展规范,K 为汉语拼音 Kuo Zhan(扩展)中“扩”字的声母。英文全称 Chinese Internal Code Specification。
GBK 共收录 21886 个汉字和图形符号
包括:
- GB 2312 中的全部汉字、非汉字符号。
- BIG5 中的全部汉字。
- 与 ISO 10646 相应的国家标准 GB 13000 中的其它 CJK 汉字,以上合计 20902 个汉字。
- 其它汉字、部首、符号,共计 984 个。
GB18030:支持简体中文及繁体中文、韩文字和少数民族的文字,GB18030编码是一二四字节变长编码
GB 18030,全称:国家标准 GB 18030-2005《信息技术中文编码字符集》,是中华人民共和国现时最新的内码字集,是 GB 18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》的修订版。GB 18030 与 GB 2312-1980 和 GBK 兼容,共收录汉字70244个。
与 UTF-8 相同,采用多字节编码,每个字可以由 1 个、2 个或 4 个字节组成。
编码空间庞大,最多可定义 161 万个字符。
支持中国国内少数民族的文字,不需要动用造字区。
汉字收录范围包含繁体汉字以及日韩汉字