1、Ansi:字符集 包括 Ascii,Gb2312,GBK,还有其他国家自己定义的字符集。GB2312 用两个字符表示一个中文字符,所以ansi编码下用strlen 时,一个中文字符为2. 而定义的这些Ansi字符集之间是冲突的,微软用代码页方式解决他们之间的冲突。所谓的内码和外码是指 全屏、五笔、微软拼音等与GB2312之间的关系。
2、Unicode:是字符集。采用2个字节表示世界上所以字符。 实现方式UTF-16小尾序(BOM)、UTF-16大尾序(BOM)和 UTF-8,对应window, 文本编辑器另存为的3中格式。可以用ue打开查看2进制编码。
3、在window中,用char表示ansi,wchar表示unicode宽字节。
4、ansi 和unicode 的转换可以用M u l t i B y t e To Wi d e C h a r之类的函数实现
5、ansi,gb2312,unicede既是字符集也是字符编码, 而utf8 是编码方式