Windows字符集的理解
字符集分两种一种是:多字节、 一种是:宽字节
多字节字符集(MBCS,Multi-Byte Chactacter Set):指用多个字节来表示一个字符的字符编码集合。一般英文字母用1Byte,汉语等用2Byte来表示;主要用于英文
在最初的时候,Internet上只有一种字符集——ANSI的ASCII字符集,它使用7 bits来表示一个 字符,总共表示128个字符,其中包括了 英文字母、数字、标点符号等常用字符
为了扩充ASCII编码,以用于显示本国的语言,这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码,又称为"MBCS
宽字节字符集:一般指Unicode编码的字符集,Unicode称为统一码或万国码,统一了不同国家的字符编码。主要用于中文韩文等等 的特殊字符,相当于一个字符对应多个字节
Unicode通常用两个字节表示一个字符
原有的英文编码从单字节变成双字节,只需要把高字节全部填为0就可以
因为最编程语言开始都是用英文的,不会出现其他中文韩文印度文这一类,所以为了兼容其他不同语言去使用
当使用的字符串是有中文的时候要使用Unicode 并且在代码中要使用相应的转换。