关于C++支持多国语言字符编码的问题

    不同语言,不同编码之间的转换很容易造成乱码,经过一翻折腾,可以确定的是,在VC++中,ASCII用的是gb2312编码,这种方式和操作系统使用的字符编码相关。UNICODE用的是UTF-16LE编码,这种就是宽字符版的统一字符集,可以容纳世界上所有的语言。所以想要对多国语言进行过滤操作,UTF-8只可以转成wstring进行操作。


    由于C++本身并不支持UTF-8编码,所以需要先将编码转换为Unicode,即wstring,但是在用std::wfstream写文件的时候,发现英文可以正常写入,一旦遇到中文,藏文非英文字符,就自动截断并结束!!!


    解决方法是还是使用std::fstream,打开文件的时候用二进制方式,std::ios::binary,在写入的时候改成,file.write((char*)utf8String.data(), utf8String.size() * 2);即可解决该问题,最好是在文件开头写入UNICOD的表示,"\xFF\xFE ",这样乱码问题解决,而且支持其他语言。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值