在写CSV文件的时候,发现无法写入中文。排查发现是字符区域设定的问题。
原因解释:
因为在C/C++语言标准中定义了其运行时的字符集环境为”C”,也就是ASCII字符集的一个子集,那么mbstowcs在工作时会将cstr中所包含的字符串看作是ASCII编码的字符,而不认为是一个包含有chs编码的字符串,所以他会将每一个中文拆成2个ASCII编码进行转换,这样得到的结果就是会形成4个wchar_t的字符组成的串,那么如何才能够让mbstowcs正常工作呢?在调用mbstowcs进行转换之间必须明确的告诉mbstowcs目前cstr串中包含的是chs编码的字符串,通过setlocale( LC_ALL, “chs” )函数调用来完成,需要注意的是这个函数会改变整个应用程序的字符集编码方式,必须要通过重新调用setlocale( LC_ALL, “C” )函数来还原,这样就可以保证mbstowcs在转换时将cstr中的串看作是中文串,并且转换成为2个wchar_t字符,而不是4个。
实现代码:
//读取区域设定
char* old_locale = _strdup(setlocale(LC_CTYPE, NULL));
//设定“简体中文”区域
setlocale(LC_CTYPE, "chs");
//创建文件并以文本方式打开
CStdioFile csdioFile;
if (!csdioFile.Open(_T("D:\abc.csv"), CFile::modeCreate | CFile::modeReadWrite | CFile::typeText))
{
csdioFile.Close();
return;
}
//写入简体中文数据
csdioFile.WriteString(_T("我是一条测试语句"));
csdioFile.Close();
//恢复区域设定
setlocale(LC_CTYPE, old_locale);
free(old_locale);