MinGW-W64使得printf、cout、wprintf、wcout显示出中文的种种

使用MinGW-W64-gcc 4.9.2 的64位 posix线程 seh异常机制的编译器。它内置了iconv支持,可以在UTF-8与gbk之间来回转码,这个很重要。


说明:printf、cout、wprintf、wcout这些如何输出中文,C/C++语言标准完全没提其实现细节。所以这些是针对具体的编译器环境而不同的。MinGW-W64、Linux GCC、Microsoft Visual C++都有所出入。


1  为使得printf显示出中文,仅需要

gcc 命令行选项-fexec-charset=gbk

这意味着编译器生成的可执行文件的字符串的内容都是按照gbk编码的。在Windows环境下调用相应的C的stdout,正确显示毫无问题。


2  为使得cout显示出中文,仅需要

gcc 命令行选项-fexec-charset=gbk

这意味着cout应该是完全基于C的stdout实现。


3    使wprintf能输出汉字,需要且仅需要这一行:

_setmode(_fileno(stdout), _O_WTEXT);            // 需要 #include <io.h> 和 <fcntl.h>

及gcc 命令行选项-fexec-charset=gbk

但是在Visual C++与Linux gcc中,都不支持上述_setmode函数,虽然这两个编译器已经充分实现了wprintf、wcout输出中文。

但是,上述_setmode语句会造成wcout输出中文与英文字符时一片乱码!

可见,wprintf是使用了C语言的标准输出stdout。仅此而已。至于stdout应该采取的默认编码字符集,由gcc 命令行选项-fexec-charset=gbk指定即可。


4  为使得wcout输出中文,仅需要下述2条语句:

setlocale(LC_ALL, "");                          // 需要 #include <locale>

std::ios_base::sync_with_stdio(false);       // 缺少的话,wcout输出的 wchar_t字符串会漏掉中文字符

    /*  ios_base::sync_with_stdio 决定 C++ 标准 streams (cin,cout,cerr...) 是否
    *  与相应的 C 标准程序库文件 (stdin,stdout,stderr) 同步,
    *  也就是是否使用相同的 stream 缓冲区,缺省情况是同步的。
    *  但由于同步会带来某些不必要的负担,因此该函数作用就是我们自己可以取消同步
    *  std::ios::sync_with_stdio(false);
    *  注意:必须在任何 io 操作之前取消同步
    */

完全不需要  std::wcout.imbue(std::locale(""));           // 使 wcout 使用操作系环境中缺省的 locale

由此可见,wcout是独立于C的标准输出stdout而独立实现的;且在把宽字符转换为操作系统默认字符编码时,使用了C语言标准的locale设置(即setlocale函数),没有setlocale函数的设置,仅靠gcc命令行选项gcc 命令行选项-fexec-charset=gbk是不行的。

仅此而已。


5  示例程序

#include <iostream>
#include <locale>
#include <cstdio>
#include <io.h>
#include <fcntl.h>

int main(void)
{
    printf("printf的内容\n");

    std::cout << "cout 的内容" << std::endl;

    
    //fflush(stdout); //must be done before _setmode  实测不需要这行
    //_setmode(_fileno(stdout), _O_WTEXT);            // 需要 #include <io.h> 和 <fcntl.h>
    wchar_t t[] = L"pure english\n";
    wprintf(L"wprintf: %ls", t);
    wprintf(L"wprintf: C 宽字符字符串\n");


    //setlocale(LC_ALL, "");                          // 需要 #include <locale>
    //std::ios_base::sync_with_stdio(false);       // 缺少的话,wcout wchar_t 会漏掉中文
    /*  ios_base::sync_with_stdio 决定 C++ 标准 streams (cin,cout,cerr...) 是否
    *  与相应的 C 标准程序库文件 (stdin,stdout,stderr) 同步,
    *  也就是是否使用相同的 stream 缓冲区,缺省情况是同步的。
    *  但由于同步会带来某些不必要的负担,因此该函数作用就是我们自己可以取消同步
    *  std::ios::sync_with_stdio(false);
    *  注意:必须在任何 io 操作之前取消同步
    */
    //std::wcout.imbue(std::locale(""));           // 使 wcout 使用客户环境中缺省的 locale

    std::wcout << L"wcout: pure english" << std::endl;
    std::wstring u = L"wcout: C++ 宽字符版 string";
    std::wcout << L"wstring u 的内容是:" << u << std::endl;
    std::wcout << L"wstring u 的字符数为:" << u.size() << std::endl;

    return 0;

}




ps.

On Windows, the only way to achieve direct Unicode output is via WriteConsoleW(). The MS CRT (2008 and newer) provides a way to use C/C++ I/O facilities for direct Unicode output:

Code:
?
1
2
3
4
5
6
7
8
9
10
11
12
13
#include <fcntl.h>
#include <io.h>
#include <cstdio>
#include <cwchar>
#include <iostream>
using namespace std;
int main()
{
     _setmode(_fileno(stdout), _O_U16TEXT);
     fputws(L "\u00e7\n" , stdout);
     wcout << L "\u00e7" << endl;
     return 0;
} //main
This will send the UTF16LE string directly to WriteConsoleW(), unless output is redirected to a file, in which case the UTF16LE string is written as a stream of bytes via WriteFile().

  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值