判定文件编码或文本流编码的方法

import info.monitorenter.cpdetector.io.ASCIIDetector;
import info.monitorenter.cpdetector.io.CodepageDetectorProxy;
import info.monitorenter.cpdetector.io.JChardetFacade;
import info.monitorenter.cpdetector.io.ParsingDetector;
import info.monitorenter.cpdetector.io.UnicodeDetector;

import java.io.ByteArrayInputStream;
import java.io.File;
import java.io.IOException;
import java.io.InputStream;
import java.net.MalformedURLException;
import java.nio.charset.Charset;

/**
 * <p>
 * 本类用来探测字符的编码集,关返回其名称
 * </p>
 * 
 * @ * @vision 1.0
 */
public class Detector {
	/*------------------------------------------------------------------------ 
	  detectorProxy是探测器,它把探测任务交给具体的探测实现类的实例完成。 
	  cpDetector内置了一些常用的探测实现类,这些探测实现类的实例可以通过add方法 
	  加进来,如ParsingDetector、 JChardetFacade、ASCIIDetector、UnicodeDetector。   
	  detector按照“谁最先返回非空的探测结果,就以该结果为准”的原则返回探测到的 
	  字符集编码。 
	--------------------------------------------------------------------------*/
	private static CodepageDetectorProxy detectorProxy;
	static {
		detectorProxy = CodepageDetectorProxy.getInstance();
		/*------------------------------------------------------------------------- 
		  ParsingDetector可用于检查HTML、XML等文件或字符流的编码,构造方法中的参数用于 
		  指示是否显示探测过程的详细信息,为false不显示。 
		---------------------------------------------------------------------------*/
		detectorProxy.add(new ParsingDetector(false));
		/*-------------------------------------------------------------------------- 
		  JChardetFacade封装了由mozilla1组织提供的JChardet,它可以完成大多数文件的编码 
		  测定。所以,一般有了这个探测器就可满足大多数项目的要求,如果你还不放心,可以 
		  再多加几个探测器,比如下面的ASCIIDetector、UnicodeDetector等。 
		 ---------------------------------------------------------------------------*/
		detectorProxy.add(JChardetFacade.getInstance());
		// ASCIIDetector用于ASCII编码测定
		detectorProxy.add(ASCIIDetector.getInstance());
		// UnicodeDetector用于unicode1家族编码的测定
		detectorProxy.add(UnicodeDetector.getInstance());

	}

	public static synchronized String getEncodingType(String content)
			throws IllegalArgumentException, IOException {
		ByteArrayInputStream stream = new ByteArrayInputStream(content
				.getBytes());
		return Detector.getEncodingType(stream, content.length());
	}

	public static synchronized String getEncodingType(File file)
			throws MalformedURLException, IOException {
		Charset charset = detectorProxy.detectCodepage(file.toURL());
		if (charset != null) {
			return charset.name();
		} else
			return "未知";
	}

	public static synchronized String getEncodingType(InputStream inputStream,
			int length) throws IllegalArgumentException, IOException {
		Charset charset = detectorProxy.detectCodepage(inputStream, length);
		if (charset != null) {
			return charset.name();
		} else
			return "未知";
	}
}

 

1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看REAdMe.md或论文文件(如有),本项目仅用作交学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看REAdMe.md或论文文件(如有),本项目仅用作交学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看READme.md或论文文件(如有),本项目仅用作交学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交学习参考,请切勿用于商业用途。 、 1资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看READmE.文件(md如有),本项目仅用作交学习参考,请切勿用于商业用途。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交学习参考,请切勿用于商业用途。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值