自己在完成一个小作业题时,需要频繁用到文本文件的读取。但由于对文本文件中中文字符输入并不熟悉,结果十分之诡异。同样的读取方式(file.getline(pchar, size+1, end)
,pchar是char指针),对于不同的文本文件结果完全不一样…一个读取完全正常,一个读取结果却是乱码。好吧,只好慢慢地debug,但是查了半个小时也并不知道所以然。
经过一番排查,注意到了下面这个细节:
两个文件的编码方式不一样!一个是UTF-8,一个是ANSI,问题就出在这。知道了问题所在,把文本编码方式改回ANSI后,程序正常。如果直接把UTF-8编码文件使用ANSI方式查看(Notepad++自带功能),会出现下面结果:
解决了这个问题,不禁好奇,对于UTF-8编码的文本文件,在C++里什么才是正确的输入输出方法?简单地到网上搜索,结论是使用宽字符char(wchar_t)数组,以及与之相应的输入输出格式。先在这里挖个坑(原谅我),以后填坑。