一、字符编码
1、计算机编码
ASCII
2、国际编码
Unicode(UTF-8、UTF-16、UTF-32)
Unicode 将全球所有的字符统一编码,解决了字符集不兼容和字符转换的问题。全世界通用。
3、中文编码
GB2312
GB2312-80字符集,国家标准字符集(GB国标)。收入汉字6763个普遍使用的简体字字符集。
GBK
GBK字符集,国家标准扩展字符集(GB国标;K,即扩展),兼容GB2312-80标准。
GB18030
GB18030字符集,包含GBK字符集,共计27533个汉字。
常用的中文编码
GBK、GB18030、Unicode
GBK和GB18030占用空间小,Unicode通用性强,占用空间大。
不考虑全球通用,实际应用还是选择GBK和GB18030。
二、Linux(CentOS7)字符集设置
查看系统字符集
locale
查看系统安装的字符集