识别中文编码GBK和UTF-8的简单方法

中文中经常用到的两种编码是GBK和UTF-8,当对字符流进行处理时,只需要简单的区分这两种编码即可。

对于UTF-8编码格式的文本文件,其前3个字节的值就是-17、-69、-65,所以,判定是否是UTF-8编码格式的代码片段如下:
# java.io.File f=new java.io.File("待判定的文本文件名");
# try{
# java.io.InputStream ios=new java.io.FileInputStream(f);
# byte[] b=new byte[3];
# ios.read(b);
# ios.close();
# if(b[0]==-17&&b[1]==-69&&b[2]==-65)
# System.out.println(f.getName()+"编码为UTF-8");
# else System.out.println(f.getName()+"可能是GBK");
# }catch(Exception e){
# e.printStackTrace();
# }

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值