fstream 和中文路径
有时候用ifstream或ofstream打开带有中文路径的文件会失败。
解决办法:
1、使用C语言的函数设置为中文运行环境
setlocale(LC_ALL,"Chinese-simplified");
2、使用STL函数设置为系统语言环境
std::locale::global(std::locale(""));
当然选2啦!
另转载针对该问题的详细讨论:http://haoren.blogbus.com/logs/2278697.html
前两天写的一个程序里面,发现中文路径扫描有问题,无法得出带有中文路径的文件的CRC值以及文件大小。因为这两个获得都是通过fstream实现的,跟踪了一下发现2005中的fstream对中文路径处理存在BUG。
跟 踪后找到问题所在,原来2005中为了让std::wfstream(这个是MS自己搞的东西,C++标准中并未规定有wfstream)的路径支持 wchar_t,所有底层函数的路径都是转换成wchar_t来进行操作的。而在此之前VC2003的wfstream并不支持wchar_t作为路径, 写STL的人并未使用MS的标准API:MultiByteToWideChar及WideCharToMultiByte来进行wchar_t和 char之间的转换,而是用了C库的wcstombos来进行转换。而wcstombos并不像MultiByteToWideChar这样的函数可以在 参数中指定代码页设置,它只接受当前全句的locale设置。当全局的locale设置并不为wcstombos所要转换的文字的代码页时,BUG就出现 了。
默认的locale设置为ANSI C,通过设置代码页为".936"可以解决中文DBCS到UNICODE的转换。因此,如果要解决这个BUG可以:
setlocale(LC_CTYPE, ".936");
设置全局locale来解决。不过
这 样将导致全局的locale改变。wcstombos是标准C库中的函数,并非STL中的库函数,所以无法只用locale类来对它造成单一影响。这么设 置的话,有可能std::cout将无法正确输出中文名,造成的影响似乎有点得不偿失。所以这个BUG最好不要用这种方式解决。还是等MS的SP补丁出来 看看是否解决了这个问题。在此之前可以考虑用C库的fopen来代替fstream.
最后:上面说过fstream底层都是用wchar_t来处理路径的,如果事先把路径转换成wchar_t传入进去也是可以的,但是这样也会带来一些问题:比如说VC2005以前的编译器将无法编译。
另转载对进行上述修改后造成的cout无法输出中文的解决方案:http://elanso.com/ArticleModule/HaHGMbTDPKHaSYHQSsSEM6Ii.html
前几天发了这篇《用fstream对二进制文件的读写 》,有朋友指出了VS2005的fstream对于中文路径支持不好的bug。我想大概是因为VS2005更加重视了对字符串的全球化支持,所以鼓励我们使用unicode编码的字符串,对于MBCS之类的支持可能就疏忽了吧。
我搜索了一下这个问题的解决,参考了如下资料写了演示代码。
- fstream 和 中文路径 c++博客
- About unicode settings in visual studio 2005, it really puzzled me a lot ms forum
- MSDN
我综合了以上的内容,总结了3种方法,能够较好解决大家的困扰,包括可能无法使用cout的问题。
/********************************************************************
created: 2008/05/10
created: 10:5:2008 23:56
filename: k:/sj/fstreamTest/fstreamTest/main.cpp
file path: k:/sj/fstreamTest/fstreamTest
file base: main
file ext: cpp
author: Gohan
*********************************************************************/
#include
#include
#include
using namespace std ;
int main()
{
/************************************************************************/
/* 方法1,使用_TEXT()宏定义将字符串常量指定为TCHAR*类型 */
/* 如果是我,首选此类型 */
/************************************************************************/
fstream file ;
file.open(_TEXT("c://测试//测试文本.txt"));
cout<<PRE>
file.close();
/************************************************************************/
/* 方法2,使用STL中的locale类的静态方法指定全局locale */
/* 使用该方法以后,cout可能不能正常输出中文,十分蹊跷 */
/* 我发现了勉强解决的方法:不要在还原区域设定前用cout或wcout 输出中文 */
/* 否则后果就是还原区域设定后无法使用cout wcout输出中文 */
/************************************************************************/
locale :: global(locale(""));//将全局区域设为操作系统默认区域
file.open("c://测试//测试文本2.txt");//可以顺利打开文件了
locale :: global(locale("C"));//还原全局区域设定
cout<<PRE>
file.close();
/************************************************************************/
/* 方法3,使用C函数setlocale,不能用cout输出中文的问题解决方法同上 */
/************************************************************************/
setlocale(LC_ALL,"Chinese-simplified");//设置中文环境
file.open("c://测试//测试文本3.txt");//可以顺利打开文件了
setlocale(LC_ALL,"C"); //还原
cout<<PRE>
file.close();
}
补充一下,第一种方法,如果不是静态字符串当作路径的话,记得传入TCHAR*类型字符串作为路径,应该就没问题了。