csv文件包含不可读字节

    今天遇到一个奇怪的问题,将一个window下的csv文件拷贝到Ubuntu下面,采用Java FileReader读取该文件,发现第一行始终包含空白字符。经过搜索,发现这个是由于csv采用的是window系统默认的utf8-bom格式,而非通用的utf8格式。在notepad++里面将格式转换为utf8编码后,问题解决。

    bom的用途:

  • 标识字节顺序,即大小字节序(主要针对utf-16和utf-32)。
  • 标识字节流是unicode编码。
  • 标识以何种unicode编码方式进行的编码。

    需要注意的是,utf8编码虽然可以采用bom(0xEF,0xBB,0xBF),但是这种用法是不推荐的,只有window才采用了这种格式,通用的应该是utf8。

参考资料:

转载于:https://my.oschina.net/u/2366460/blog/1507361

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值