解析包含中文的xml出现编码错误Invalid byte 1 of 1-byte UTF-8 sequence

原因为:以非utf-8的编码格式执行保存操作

1、最简单就是把<?xml version="1.0" encoding="UTF-8"?>改成<?xml version="1.0" encoding="gbk"?>:对于字符串直接替换;对于文件,先读取,替换,最后解析写回
2、或者把xml打开另存的时候把字符集改为UTF-8后保存
3、在代码解析的时候先把xml重新写一遍
 SAXReader reader = new SAXReader(); 
  org.dom4j.Document document = reader.read("D:\\ha.xml"); 
  OutputFormat of = new OutputFormat(); 
  of.setEncoding("UTF-8"); //改变编码方式 
  XMLWriter writer = new XMLWriter(new FileWriter "d:\\dom4j.xml"), of); 
4、直接dom4j读取的时候用io来读,修改字符编码
FileInputStream in = new FileInputStream(new File(fileName));
Reader read = new InputStreamReader(in,"gbk");
Document document = reader.read(read);

5、还有可能出现以utf-8格式保存仍无法使用,此时,可使用org.w3c.dom.Document进行解析保存。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值