移除UTF8文件的BOM头

开发时遇到过的UTF8文件有BOM头、导致文件不能正常解析这问题,BOM是什么这个问题请参考如下地址:
https://en.wikipedia.org/wiki/Byte_order_mark
UTF8 与 UTF8 +BOM 区别
其实就是在文件头部的3个字节:EF BB BF,而且是不可见的,可以用于标示字节编码顺序(Big-Endian/Little- Endian),UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。Windows就是使用BOM来标记文本文件的编码方式的。此处整理一下移除BOM头的方法:
【1】文本编辑器
UltarEdit/Sublime/notepad++都可以方便的转化(比如notepad++“另存为”)
【2】编码实现
平时开发一直用java,此处给出java实现(亲测,参考自:移除UTF-8文件头的bom):


public static byte[] removeUTF8BOM(byte[] bt) {
    if (bt != null && bt.length > 3) {
         // 前三个字节依次是 EF BB BF
         if (bt[0] == -17 && bt[1] == -69 && bt[2] == -65) {
                 byte[] nbs = new byte[bt.length - 3];
                 System.arraycopy(bt, 3, nbs, 0, nbs.length);
                 return nbs;
         }
     }
     return bt;
 }

其他处理方式:Java处理文件BOM头的方式推荐

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值