utf-8和txt文件不能很好的区分,就算是记事本也无法很好的区分

在win7上,新建一个txt文件,输入“联通”。关闭后打开会出现“��ͨ”。why。

txt文件编码格式

  • bom。微软为了正确判断文件格式,在Unicode编码格式的文件头部添加了bom信息。当程序读取文件内容的时候,首先会读到这个bom,然后根据bom来判断是那种UTF编码格式。

    utf-8 的bom的byte为 -17 -69 -65。网上许多程序都是以此来判断文件是否是UTF-8格式。但是,windows上的UTF-8编码格式的文本文件可以不带bom。也就是说这种方式适配性并不好。
    新建一个txt文件,输入“联通”。用程序读取后,其内容的byte为:-63 -86 -51 -88

  • UTF的bom编码

    UTF-8: EF BB BF
    UTF-16 : FF FE
    UTF-16 big-endian: FE FF
    UTF-32 little-endian: FF FE 00 00
    UTF-32 big-endian: 00 00 FE FF

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值