在深入理解c++11一书中有说两个字符集,一个源码字符集,一个编码字符集(在msvc编译器文档里面叫做执行字符集)。
一个是文件的保存格式。
一个是编译器在编译过程中如何编码字符串。
文件用utf-8文件格式的时候,一般会出现如下错误
该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失
首先最容易的解决方式就是改文件编码为gbk,或者utf-8withbom。
为什么utf8不行,utf8withbom就可以呢,仅仅是因为vs不认识utf8编码,所以把utf8编码的文件当作默认的ansi编码文件,这个时候就会出现上述报错。但是utf8withbom的编码和gbk的编码vs都是认识的,所以就没有问题。
我们可以通过编译选项指定源码字符集和编码字符集。
编译的时候增加 /utf-8 选项即可同时指定上述两个字符集。
参考文章
https://docs.microsoft.com/zh-cn/windows/win32/Intl/code-page-identifiers
上面那样操作了之后编译运行都没有问题了。
但是想要将utf8的字符输出到控制台的时候会发现乱码。
简单的做法是在输出之前执行 system(“chcp 65001”); 改变控制台的编码,其他方式的话可以按照c++的国际化方式进行编码转换。