msvc cout 输出non-ASCII 的 utf8 字符串乱码
msvc 工程 .cpp 代码里,用 std::cout 输出 non-ASCII utf8 字符串(比如中文字串)乱码, 而把同样字串用 printf()输出却是正常的。
SetConsoleOutputCP(CP_UTF8);
printf("\xe5\xae\x81 \xe9\x9d\x99.\n"); // 输出 "宁静",该行总能正常输出
std::cout << "\xe5\xae\x81 \xe9\x9d\x99.\n" << std::endl;
printf()输出正常,那说明这里的源字串编码是正常 utf8(不是 gbk)。
对比测试,把程序输出重定向到一个 .txt 文件里,用编辑器打该 txt 文件,文件里两行文字竟然都是 ok 的。
再次直接运行该 exe, 即直接输出 字符串到命令行窗口,其中用 std::cout 输出的字符串仍是乱码。
解法:
在程序的开始调用:
#include <windows.h>
// 在调用 SetConsoleOutputCP(CP_UTF8) 的基础上,加上
// Enable buffering to prevent VS from chopping up UTF-8 byte sequences
setvbuf(stdout, nullptr, _IOFBF, 1000);
说明,其实在 msvc 2015 里,是可以直接使用 u8"宁静" 这样的字符串常量的。(这里用内码形式的字串是为了兼容 msvc 2008)
测试环境:
Windows7 64位;
msvc 2008 sp1 和 msvc 2015。 用的是 win32 控制台应用程序方式。