计算机底层使用的是二进制,所有数据在计算机底层都是以二进制形式保存的
- 将字符转换为二进制码的过程,称为编码
- 将二进制码转换为字符的过程,称为解码
- 编码和解码时所采用的规则,称为字符集Charset
常见的字符集:
-
ASCII
美国的编码,使用7位来对美国常用的字符进行编码,包含128个字符
-
ISO-8859-1
欧洲的编码,使用8位,包含256个字符
-
GB2312、GBK
国标码,中国的编码(Windows系统默认使用GBK) -
Unicode
万国码,是一种国际标准编码,包含世界上所有的语言和符号,为每个字符设定了唯一的编码有多种实现:UTF-8(最常用)、UTF-16、UTF-32
-
中文乱码
编写程序时,由于字符集设置不对 或 编码解码时使用了不一致的字符集,会导致出现中文乱码的问题