文件的编码问题

   文件的编码问题,一直很头疼,现在终于解决了。
要想正确打开文件,首先要知道文件的字符集(CharaterSet),其次是要知道这种字符集是用什么编码(encode)来存储的,然后用对应的Java方法打开,这样就能正确的打开文件,而不出现乱码。
    1.文件的字符集在Windows下有两种,一种是ANSI,一种Unicode。对于Unicode,Windows支持了它的三种编码方式,一种是小尾编码,一种是大尾编码,一种是UTF-8编码。怎么区分一个文件是属于哪种编码?从文件的头部区分,当头部的两个字节为 FF FE时,这是Unicode的小尾编码,当它为FE FF时,这是Unicode的大尾编码,当它为EF BB BF时,这是Unicode的UTF-8编码,当它不为这些时,这是ANSI编码。
    2.从程序角度出发,实际上只要知道头一个字节的值,就能区分它是属于哪种字符集,哪种编码。
    3.对于大、小尾码,用inReader = new InputStreamReader(inStreamfile1, "unicode");
      对于UTF-8码,用inReader = new InputStreamReader(inStreamfile1, "utf-8");
      对于ANSI集,用inReader = new InputStreamReader(inStreamfile1);
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值