解析XML文件时的乱码问题

使用的是SAX解析器:
Java代码 复制代码 收藏代码
  1. DocumentBuilderFactory doDocumentBuilder = DocumentBuilderFactory.newInstance();
  2. DocumentBuilder docBuilder = doDocumentBuilder.newDocumentBuilder();
    DocumentBuilderFactory doDocumentBuilder = DocumentBuilderFactory.newInstance();
    DocumentBuilder docBuilder = doDocumentBuilder.newDocumentBuilder();


1. 输入流是字符流,经过InputSource封装后,解析器可以直接读取该流:
Java代码 复制代码 收藏代码
  1. BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream("dialect.xml"), "WINDOWS-1252"));
  2. InputSource is = new InputSource(reader);
  3. Document doc = docBuilder.parse(is);
  4. doc.getDocumentElement().normalize();
	BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream("dialect.xml"), "WINDOWS-1252"));
	InputSource is = new InputSource(reader);
	Document doc = docBuilder.parse(is);
	doc.getDocumentElement().normalize();


2. 输入流是字节流:

a. 使用在InputSource中指定的编码,所以要调用setEncoding()方法来指定编码。
Java代码 复制代码 收藏代码
  1. BufferedInputStream bis = new BufferedInputStream(new FileInputStream("dialect.xml"));
  2. InputSource is = new InputSource(bis);
  3. is.setEncoding("WINDOWS-1252");
  4. Document doc = docBuilder.parse(is);
	BufferedInputStream bis = new BufferedInputStream(new FileInputStream("dialect.xml"));
	InputSource is = new InputSource(bis);
	is.setEncoding("WINDOWS-1252");
	Document doc = docBuilder.parse(is);


b. 如果没有传入编码参数,解析器会根据XML文件中声明的编码来解析

Xml代码 复制代码 收藏代码
  1. <?xml version="1.0" encoding="WINDOWS-1252"?>
  2. <dialects>
  3. </dialects>


c. 如果XML文件中也没有编码声明,则根据XML规范中的算法自动探测字符编码,这样很有可能产生乱码情况。 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值