在计算机中,任意数据都是以二进制的形式来储存的
存储英文时,一个字节就可以
ASCLL
该1100001不够8位,即不够1个字节,需要进行编码
ASCLL编码规则:前面补0,补齐8位
110 0001编码为0110 0001
ASCLL解码规则:直接转成十进制
0110 0001 解码为97
GBK
汉字用GBK规则存储,ANSI
规则一:汉字两个字节存储
规则二:高位字节二进制一定以1开头,转成十进制之后是一个负数
总结
Unicode(万国码):国际标准字符集,将世界各种语言每个字符定义一个唯一的编码
UTF-16(Unicode Transfer Format)编码规则:用2-4个字节保存
UTF-32编码规则:固定使用四个字节保存
最常见用UTF-8编码规则:用1-4字节保存
例子:
总结