JAVA读取不同编码的txt文件,java获取txt文件编码格式

下面这个函数亲测实验成功。

获取txt编码格式函数如下:

  private String getCharset(String fileName) throws IOException{
        
            BufferedInputStream bin = new BufferedInputStream(new FileInputStream(fileName));  
            int p = (bin.read() << 8) + bin.read();  
            
            String code = null;  
            
            switch (p) {  
                case 0xefbb:  
                    code = "UTF-8";  
                    break;  
                case 0xfffe:  
                    code = "Unicode";  
                    break;  
                case 0xfeff:  
                    code = "UTF-16BE";  
                    break;  
                default:  
                    code = "GBK";  
            }  
            return code;
    }

测试读取文件:

 public String getTextFromText(String filePath){
        
            try {
                InputStreamReader isr = new InputStreamReader(new FileInputStream(filePath),getCharset(filePath));
                BufferedReader br = new BufferedReader(isr);
                
                StringBuffer sb = new StringBuffer();   
                String temp = null;   
                while((temp = br.readLine()) != null){   
                    sb.append(temp);   
                }   
                br.close();        
                return sb.toString();   
            } catch (FileNotFoundException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
                
            }catch (IOException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }   
            return null;
    }

原文http://blog.sina.com.cn/s/blog_68ed2a9b0100vqrn.html


备注:

实验发现这篇文章(http://tinyking.blog.51cto.com/3338571/667453)给的方法不行。

InputStream inputStream = new FileInputStream("E:/1.txt");  
        byte[] head = new byte[3];  
        inputStream.read(head);    
        String code = "";  
   
            code = "gb2312";  
        if (head[0] == -1 && head[1] == -2 )  
            code = "UTF-16";  
        if (head[0] == -2 && head[1] == -1 )  
            code = "Unicode";  
        if(head[0]==-17 && head[1]==-69 && head[2] ==-65)  
            code = "UTF-8";  
          
        System.out.println(code); 



  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值