1.出现时间
GB2312(80年)->GBK(1995)->GB18030(2005)
2.编码规则
(1)GB2312和GBK规则一致
对于 ASCII 字符,使用一个字节存储,并且该字节的最高位是 0,这意味着兼容ASCII。
对于中国的字符,使用两个字节存储,并且规定每个字节的最高位都是 1。
(2)GB18130的编码规则
对于 ASCII 字符,使用一个字节存储,并且该字节的最高位是 0,这和 ASCII、GB2312、GBK 编码是一致的。
对于常用的中文字符,使用两个字节存储,并且规定第一个字节的最高位是 1,第二个字节的高位最多只能有一个连续的 0(第二个字节的最高位可以是 1 也可以是 0,但是当它是 0 时,次高位就不能是 0 了)。
对于罕见的字符,使用四个字节存储,并且规定第一个和第三个字节的最高位是 1,第二个和第四个字节的高位必须有两个连续的 0。
(3)如何判断用文本占了几个字节
从左往右扫描,如何第一个字节的高位是0,肯定只占用一个字节。
如果第一个字节的高位是1,那么可能占用四个字节或者两个字节。
继续判断第二个字节,如果第二个字节的高位没有两个连续的0,那就是占用了两个字节,如果有两个连续的0,那就是占用了四个字节
以上学习心得,当个笔记看