cpdetector是一个识别文件的工具。常用的utf - 8 ,还有GBK,都能够很好的识别,可以到官网上下载最新的jar包,一定要将cpdetector_1.0.8.jar,antlr-2.7.4.jar,还有chardet-1.0.jar引入其中。
CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance();
detector.add(JChardetFacade.getInstance());
detector.add(new ParsingDetector(false));
// ASCIIDetector用于ASCII编码测定
detector.add(ASCIIDetector.getInstance());
// UnicodeDetector用于Unicode家族编码的测定
detector.add(UnicodeDetector.getInstance());
java.nio.charset.Charset charset = null;
try {
charset = detector.detectCodepage(src.toURL());
return charset.name();
} catch (Exception ex) {
ex.printStackTrace();
}