字符编码格式
作用:
编码格式是展示内容用的,和计算机cpu建的协议规范。最早的是ASCII码(128或256种字符),没有定义中文,后来中国人定义了GB2312和GBK,含有中文字符的定义。
但有个问题,不同编码格式间转换的时候会出现乱码,没有统一标准,所以无法转换。不同的字符集,不同的内容编码或转码就会显示乱码,就是出现乱码的原因。
所以就出现了一个可以包含所有字符的万国码:
->Unicode。
Unicode分为UTF-8(可变字节1-4个字节),UTF-16,UTF-32.
分为:
GB2312:
ANSI(扩展的ASCII编码):一个字节
UTF-8编码:英文一个字节,中文三个字节,是unicode的一种实现方式,可扩展性强
GBK编码:两个字节
Unicode编码:万国码
内容不管是读取和展示都需要用到数据编码。这个过程中会牵扯很多环节,每个环节都编码格式都需要统一,不管哪个地方出了问题都会显示乱码,所以在展示乱码时,要排除过程中各个阶段的编码格式。
解码和编码
过程可以理解成,在金银首饰制作过程中,需要把金子融掉再定型。融掉金子过程是解码,再定型是编码。
学习了方法,还需要如何使用,运用到实际的工作中。编程需要一个时间的累积,打基础很重要。