ASCII码
一个ASCII码值占一个字节(8个二进制位),其最高位(b7
)用作[奇偶校验位]
奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7
添1;
偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7
添1。
备注:48=‘0’ 65=‘A’ 97=‘a’
Unicode码:它前128个字符就是ASCII码,之后是扩展码
Unicode
和UTF-8
区别
Unicode为世界上所有字符都分配了一个唯一的数字编号,这个编号范围从 0x000000
到 0x10FFFF
(十六进制),有110多万,每个字符都有一个唯一的Unicode编号,这个编号一般写成16进制,在前面加上U+。例如:“马”的Unicode是U+9A6C
。
它是一种规定,Unicode本身只规定了每个字符的数字编号是多少,并没有规定这个编号如何存储(占几个字节存储,计算机中每八个二进制位组成了一个字节(Byte),计算机存储的最小单位就是字节),除了这种直接转换成二进制的方案外,还有其他方案,主要有UTF-8
,UTF-16
,UTF-32
UTF-8
就是使用变长字节表示,顾名思义,就是使用的字节数可变,这个变化是根据 Unicode 编号的大小有关,编号小的使用的字节就少,编号大的使用的字节就多。