转载: [url=http://blog.163.com/lyq_163_2009/blog/static/134082696201167102324698/]http://blog.163.com/lyq_163_2009/blog/static/134082696201167102324698/[/url]
GBK18030字符集简介:
GB18030编码向下兼容GBK和GB2312,兼容的含义是不仅字符兼容,而且相同字符的编码也相同。GB18030收录了所有Unicode3.1中的字符,包括中国少数民族字符,GBK不支持的韩文字符等等,也可以说是世界大多民族的文字符号都被收录在内。
链接: GB18030 GB18030标准详细内容 GB18030汉字编码标准集
GBK18030编码:
GBK和GB2312都是双字节等宽编码,如果算上和ASCII兼容所支持的单字节,也可以理解为是单字节和双字节混合的变长编码。GB18030编码是变长编码,有单字节、双字节和四字节三种方式。
GB18030 的单字节编码范围是0X00-0X7F,完全等同与ASCII;双字节编码的范围和GBK相同,高字节是0X81-0XFE,低字节的编码范围是0X40 -0X7E和0X80-0XFE;四字节编码中第一、三字节的编码范围是0X81-0XFE,二、四字节是 0X30-0X39。
Windows中CP936代码页使用0X80来表示欧元符号,而在GB18030编码中没有使用0x80编码位,用其他位置来表示欧元符号。这可以理解为是 GB18030向下兼容性上的一点小问题;也可以理解为0X80是CP936对GBK的扩展,而GB18030只是和GBK兼容良好。
GBK18030字符集简介:
GB18030编码向下兼容GBK和GB2312,兼容的含义是不仅字符兼容,而且相同字符的编码也相同。GB18030收录了所有Unicode3.1中的字符,包括中国少数民族字符,GBK不支持的韩文字符等等,也可以说是世界大多民族的文字符号都被收录在内。
链接: GB18030 GB18030标准详细内容 GB18030汉字编码标准集
GBK18030编码:
GBK和GB2312都是双字节等宽编码,如果算上和ASCII兼容所支持的单字节,也可以理解为是单字节和双字节混合的变长编码。GB18030编码是变长编码,有单字节、双字节和四字节三种方式。
GB18030 的单字节编码范围是0X00-0X7F,完全等同与ASCII;双字节编码的范围和GBK相同,高字节是0X81-0XFE,低字节的编码范围是0X40 -0X7E和0X80-0XFE;四字节编码中第一、三字节的编码范围是0X81-0XFE,二、四字节是 0X30-0X39。
Windows中CP936代码页使用0X80来表示欧元符号,而在GB18030编码中没有使用0x80编码位,用其他位置来表示欧元符号。这可以理解为是 GB18030向下兼容性上的一点小问题;也可以理解为0X80是CP936对GBK的扩展,而GB18030只是和GBK兼容良好。