GB2312为什么要从0xA1A1开始呢?
因为要区别其它编码, 比如ascii, 所以gb2312不能直接区位来编码, 而是要跳过160(0xa0)开始.
GB2312编码是从区位: A1A1开始的.
减0XA0就是对应的区码和位码.
区码是从1开始算起
位码也是从1开始算起
以汉字"我"为例
"我"的GB2312码为: 0xCED2
从文件读出来的先后顺序:0xCE 0xD2(以大端存储).
"我"的区位码为:
区码为: 46(10进制), 表示在第46区
位码为: 50(10进制), 表示在第46区的第50位
计算过程:(只要减去0xA0(160)就可以了)
0xCE - 0xA0 = 0x2E => 46(10进制)
0xD2 - 0xA0 = 0x32 => 50(10进制)