charset
是character set
的简写,即字符集
encoding
是charset encoding
的简写,即字符集编码,简称编码
-
ASCII码:是一种编码
上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定,即ASCII码
ASCII 码一共规定了128个字符的编码,占用了一个字节的后面7位,最前面的一位统一规定为0 -
Unicode:是一个字符集
用来表示世界上【所有语言】中的所有字符,每一个符号都给予一个独一无二的编码数字Unicode 仅仅只是一个字符集,规定了每个字符对应的二进制代码,但没有规定如何存储
-
UTF-8
是目前互联网上使用最广泛的一种 Unicode 编码方式,可变长存储
=
查看当前编码:
[root@centos7 ~]#echo $LANG
en_US.UTF-8