java 使用CharsetDetector检测文件的编码方式

DEMO1:从服务器上读取文件的内容   判断文件编码

URL url = new URL(getUrl);

  HttpURLConnection httpConnection =  (HttpURLConnection) url.openConnection();
             InputStream in = httpConnection.getInputStream(); 
             InputStream tempStream = url.openStream();
      CharsetDetector charDect = new CharsetDetector();
    String[] unicodeSet = charDect.detectChineseCharset(tempStream);

    BufferedReader bufferedReader = null;
    if(unicodeSet.length>0)
    bufferedReader = new BufferedReader(new InputStreamReader(in,unicodeSet[0]));
    else
    bufferedReader = new BufferedReader(new InputStreamReader(in,"gb2312"));
             StringBuffer temp = new StringBuffer();
             String line = bufferedReader.readLine();
             while (line != null) {
             temp.append(line).append("\r\n");
             line = bufferedReader.readLine();
             }
             bufferedReader.close();

            lrc= temp.toString();

DEMO2:判断本地文件编码

public static void main(String[] args){
CharsetDetector charDect = new CharsetDetector();
File f = new File("F:/demo/a.txt");
try {
String[] probableSet = charDect.detectChineseCharset(f.toURL().openStream());
for (String charset : probableSet){
           System.out.println(charset);
       }
} catch (MalformedURLException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}

封装后的jar包下载地址 http://codeinplatform.googlecode.com/files/CharsetDetector.jar 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值