libiconv库转换字符串出现BOM问题

61 篇文章 1 订阅
在使用iconv进行字符编码转换时,可能会遇到转出的字符串带有BOM头的状况,尤其是当使用utf-32或utf-16时。解决方法是明确指定编码的endian,如使用utf-32le或utf-16be,避免BOM的出现。文章还指出,Windows和Ubuntu上的wchar_t大小不同,影响Unicode编码的选择,且编码的endian并不一定与系统的endian一致。
摘要由CSDN通过智能技术生成

使用iconv转换字符编码,经常出现转出的字符串带BOM头的问题。经过测试,发现unicode编码用“utf-32”或“utf-16”,转出或转入,得到的字符串有BOM,而用“utf-32le”、“utf-32be”、“utf-16le”、“utf-16be”这样的,就不会有BOM。
所以需要明确告知iconv,编码的endian,否则转出来的字符串带BOM.

Window上wchar_t是2个字节,Ubuntu上wchar_t是4个字节,所以Unicode编码是不一样的,utf-32还是utf-16要分清,编码的endian是跟字符编码有关,不一定跟系统的endian一致。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值