最近把一个之前在VC6.0下做的工程放到VS2008下修改,结果发现编译出错,查找相关资料后,发现主要是VS2008下默认的是 使用UNICODE字符集,而在VC6.0下默认的是使用多字节字符集,结果导致CString,TCHAR等都出现一些问题,于是又顺便恶补了一下字符集相关的知识。
关于几种字符类型:
CHAR:一个字符占8位,1个字节,可以表示中文,但是会有本地化问题,就比如有时候下到一个游戏,结果发现所有文字都是乱码,需要设置本机的区域选项才可以正常显示文字,就是因为这个问题导致的,如果使用WCHAR就不会有这个问题。
WCHAR:一个字符占16位,2个字节,可以表示中文,不会有本地化问题。使用这个可以不用担心目录是否是中文之类的。
TCHAR:这个根据开发环境的字符集选项不同而不同,在使用UNICODE字符集的时候,这个是WHCAR,而使用多字节字符集的时候,这个是CHAR。
不同字符间的转换:
char sAnsi[20];
memset(sAnsi, 0x00, 20);
sprintf(sAnsi, "ANSI字符串");
//
//char TO wchar
wchar_t *pwsUnicode = NULL;
int nWChLen = MultiByteToWideChar(CP_ACP, 0, sAnsi, -1, NULL, 0); //获取转换后的wchar长度 长度为8 7个字符+1个结束符
pwsUnicode = new wchar_t[nWChLen];
MultiByteToWideChar(CP_ACP, 0, sAnsi, -1, pwsUnicode, nWChLen); //实际转换
//使用完后删除
// delete[] pwsUnicode;
// pwsUnicode = NULL;
//
//wchar TO char
char *psAnsi = NULL;
int nChLen = WideCharToMultiByte(CP_ACP, 0, pwsUnicode, -1, NULL, 0, NULL, NULL); //获取转换后的char长度 长度为11 10个字符(4+2*3)+1个结束符
psAnsi = new char[nChLen];
WideCharToMultiByte(CP_ACP, 0, pwsUnicode, -1, psAnsi, nChLen, NULL, NULL);
//使用后删除
// delete[] psAnsi;
// psAnsi = NULL;
delete[] pwsUnicode;
pwsUnicode = NULL;
delete[] psAnsi;
psAnsi = NULL;
关于第一个参数CP_ACP:
这个参数主要指的是CHAR的内容所在的字符集和WCHAR没有关系。
另外,这两个函数需要的头文件是 windows.h。
几个字符的宏:
_T("TCHAR") //根据字符集设置改变
L"WCHAR" //UNICODE字符
P.S:linux下:
这个函数在linux下有类似的函数iconv和mbstowcs、wcstombs,需要配合setlocale函数使用。如果转换函数转换失败,那么需要考虑你的linux系统是否有安装相应的字符集。如果你在setlocale时候就出错返回NULL了,那基本就是系统没有相应的字符集了,装字符集去吧。