检测编码工具juniversalchardet


// TODO Auto-generated method stub
byte[] buf = c.crawl("http://sse.bupt.edu.cn/");
//String fileName = args[0];
// String fileName = "d:/test.txt";
// java.io.FileInputStream fis = null;
// try {
// fis = new java.io.FileInputStream(fileName);
// } catch (FileNotFoundException e) {
// // TODO Auto-generated catch block
// e.printStackTrace();
// }

// (1)
UniversalDetector detector = new UniversalDetector(null);

// (2)
detector.handleData(buf, 0, buf.length);
// int nread;
// try {
// while ((nread = fis.read(buf)) > 0 && !detector.isDone()) {
// detector.handleData(buf, 0, nread);
// }
// } catch (IOException e) {
// // TODO Auto-generated catch block
// e.printStackTrace();
// }
// (3)
detector.dataEnd();

// (4)
String encoding = detector.getDetectedCharset();
if (encoding != null) {
System.out.println("Detected encoding = " + encoding);
} else {
System.out.println("No encoding detected.");
}

// (5)
detector.reset();
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值