java检测网络或本地文件字符编码（解决乱码）

最新推荐文章于 2022-10-21 10:02:17 发布

进击的小飞鱼

最新推荐文章于 2022-10-21 10:02:17 发布

阅读量2.7k

点赞数

文章标签： java 网络 mozilla file html 任务

本文链接：https://blog.csdn.net/ZSMJ_2011/article/details/7846563

版权

相信很多人在编码时遇到乱码问题，现在介绍一种检测字符编码的方法

File file=new File(filename);
FileInputStream read=new FileInputStream(file);
SAXParserFactory factory=SAXParserFactory.newInstance();
SAXParser parser=factory.newSAXParser();
	    		/*------------------------------------------------------------------------ 
	    		  detector是探测器，它把探测任务交给具体的探测实现类的实例完成。 
	    		  cpDetector内置了一些常用的探测实现类，这些探测实现类的实例可以通过add方法 
	    		  加进来，如ParsingDetector、 JChardetFacade、ASCIIDetector、UnicodeDetector。   
	    		  detector按照“谁最先返回非空的探测结果，就以该结果为准”的原则返回探测到的 
	    		  字符集编码。 
	    		--------------------------------------------------------------------------*/ 
CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance();
	    		/*------------------------------------------------------------------------- 
	    		  ParsingDetector可用于检查HTML、XML等文件或字符流的编码,构造方法中的参数用于 
	    		  指示是否显示探测过程的详细信息，为false不显示。 
	    		---------------------------------------------------------------------------*/  
detector.add(new ParsingDetector(false));
	    		/*-------------------------------------------------------------------------- 
	    		  JChardetFacade封装了由Mozilla组织提供的JChardet，它可以完成大多数文件的编码 
	    		  测定。所以，一般有了这个探测器就可满足大多数项目的要求，如果你还不放心，可以 
	    		  再多加几个探测器，比如下面的ASCIIDetector、UnicodeDetector等。 
	    		 ---------------------------------------------------------------------------*/
detector.add(JChardetFacade.getInstance());
		    	//ASCIIDetector用于ASCII编码测定  
detector.add(ASCIIDetector.getInstance());  
		    	//UnicodeDetector用于Unicode家族编码的测定  
detector.add(UnicodeDetector.getInstance());
		    	//得到编码字符集对象
Charset charset=detector.detectCodepage(file.toURI().toURL());

需要导入java包“cpdetector”