关闭

fstream 和中文路径

2744人阅读 评论(0) 收藏 举报

fstream 和中文路径 
有时候用ifstream或ofstream打开带有中文路径的文件会失败。

解决办法:
1、使用C语言的函数设置为中文运行环境
setlocale(LC_ALL,"Chinese-simplified");

2、使用STL函数设置为系统语言环境
std::locale::global(std::locale(""));

当然选2啦!

另转载针对该问题的详细讨论:http://haoren.blogbus.com/logs/2278697.html

前两天写的一个程序里面,发现中文路径扫描有问题,无法得出带有中文路径的文件的CRC值以及文件大小。因为这两个获得都是通过fstream实现的,跟踪了一下发现2005中的fstream对中文路径处理存在BUG。

跟 踪后找到问题所在,原来2005中为了让std::wfstream(这个是MS自己搞的东西,C++标准中并未规定有wfstream)的路径支持 wchar_t,所有底层函数的路径都是转换成wchar_t来进行操作的。而在此之前VC2003的wfstream并不支持wchar_t作为路径, 写STL的人并未使用MS的标准API:MultiByteToWideChar及WideCharToMultiByte来进行wchar_t和 char之间的转换,而是用了C库的wcstombos来进行转换。而wcstombos并不像MultiByteToWideChar这样的函数可以在 参数中指定代码页设置,它只接受当前全句的locale设置。当全局的locale设置并不为wcstombos所要转换的文字的代码页时,BUG就出现 了。

默认的locale设置为ANSI C,通过设置代码页为".936"可以解决中文DBCS到UNICODE的转换。因此,如果要解决这个BUG可以:

setlocale(LC_CTYPE, ".936");

设置全局locale来解决。不过
这 样将导致全局的locale改变。wcstombos是标准C库中的函数,并非STL中的库函数,所以无法只用locale类来对它造成单一影响。这么设 置的话,有可能std::cout将无法正确输出中文名,造成的影响似乎有点得不偿失。所以这个BUG最好不要用这种方式解决。还是等MS的SP补丁出来 看看是否解决了这个问题。在此之前可以考虑用C库的fopen来代替fstream.

最后:上面说过fstream底层都是用wchar_t来处理路径的,如果事先把路径转换成wchar_t传入进去也是可以的,但是这样也会带来一些问题:比如说VC2005以前的编译器将无法编译。

另转载对进行上述修改后造成的cout无法输出中文的解决方案:http://elanso.com/ArticleModule/HaHGMbTDPKHaSYHQSsSEM6Ii.html

前几天发了这篇《用fstream对二进制文件的读写 》,有朋友指出了VS2005的fstream对于中文路径支持不好的bug。我想大概是因为VS2005更加重视了对字符串的全球化支持,所以鼓励我们使用unicode编码的字符串,对于MBCS之类的支持可能就疏忽了吧。

   我搜索了一下这个问题的解决,参考了如下资料写了演示代码。

  • fstream 和 中文路径   c++博客
  • About unicode settings in visual studio 2005, it really puzzled me a lot ms forum
  • MSDN

   我综合了以上的内容,总结了3种方法,能够较好解决大家的困扰,包括可能无法使用cout的问题。

    /******************************************************************** 
         created:    2008/05/10 
        created:    10:5:2008   23:56 
         filename:     k:/sj/fstreamTest/fstreamTest/main.cpp 
        file path:    k:/sj/fstreamTest/fstreamTest 
       file base:    main 
       file ext:    cpp 
        author:        Gohan 
    *********************************************************************/  
    #include  
    #include  
    #include  
    using namespace std ;  
    int main()  
    {  
        /************************************************************************/  
        /* 方法1,使用_TEXT()宏定义将字符串常量指定为TCHAR*类型                 */  
        /* 如果是我,首选此类型                                                 */  
        /************************************************************************/  
        fstream file ;  
        file.open(_TEXT("c://测试//测试文本.txt"));  
        cout<<PRE>  
        file.close();  
          
        /************************************************************************/  
        /* 方法2,使用STL中的locale类的静态方法指定全局locale                   */  
        /* 使用该方法以后,cout可能不能正常输出中文,十分蹊跷                    */  
        /* 我发现了勉强解决的方法:不要在还原区域设定前用cout或wcout 输出中文   */  
        /* 否则后果就是还原区域设定后无法使用cout wcout输出中文                 */  
        /************************************************************************/  
        locale :: global(locale(""));//将全局区域设为操作系统默认区域  
        file.open("c://测试//测试文本2.txt");//可以顺利打开文件了  
        locale :: global(locale("C"));//还原全局区域设定  
        cout<<PRE>  
        file.close();  
          
        /************************************************************************/  
        /* 方法3,使用C函数setlocale,不能用cout输出中文的问题解决方法同上      */  
        /************************************************************************/  
        setlocale(LC_ALL,"Chinese-simplified");//设置中文环境  
        file.open("c://测试//测试文本3.txt");//可以顺利打开文件了  
        setlocale(LC_ALL,"C"); //还原  
        cout<<PRE>  
        file.close();  
    }  

补充一下,第一种方法,如果不是静态字符串当作路径的话,记得传入TCHAR*类型字符串作为路径,应该就没问题了。



0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:108054次
    • 积分:1308
    • 等级:
    • 排名:千里之外
    • 原创:25篇
    • 转载:37篇
    • 译文:0篇
    • 评论:3条
    文章分类
    最新评论