在Windows字符集中,中英文的字符编码格式是不同的,如ASCII码是一个字符对应一个字节,属于多字节。而在中文中则不行了,一个中文字符对应多个字节,属于宽字节Unicode,像utf-8编码格式,一个中文字符对应2个字节,而GBK编码格式中,一个中文字符对应3个字节。
一、TEXT与TCHAR;
当需要将多字节转换为宽字节时,可以在多字节字符前加TEXT,TEXT为自适应编码转换宏,即加了TEXT后,如果工程环境配置为多字节,TEXT将字符转换为多字节,如果工程配置为宽字节,则转换为宽字节。同理,用TCHAR定义的字符串或字符,都会自动转换为当前的编码格式。
二、统计字符串的长度;
如果为多字节,即 char* 类型,用函数 strlen() 即可;
若为 宽字节,即 wchar_t* 或 WCHAR *类型,用函数 wcslen() 。
三、char*与CString类型之间的互换
(1) char* 转换为 CString
char * str0 = "aaaaaaa";
CString str1 = CString(str0);
(2) CString 转换为 char*
CString str = TEXT("aaa");
CStringA stra;
stra = str;
//注意:不能直接CStringA stra = str; 我也不明白为什么
//编译器给出的解释为 不存在用户定义的从“CString"到"CStringA"的适当转换
char * string = stra.GetBuffer();