关于DOM4J处理XML文件中的编码问题

   今天项目中遇到两个异常
   其一、
    org.dom4j.DocumentException: no protocol: <?xml version="1.0" encoding="UTF-8"?>
    产生这个异常的语句是
    document=reader.read(new String(xml.getBytes("UTF-8")));

    其二、
    org.dom4j.DocumentException: Error on line 2 of document  : Invalid byte 2 of 2-byte UTF-8        sequence.
    document= reader.read(new StringInputStream(xml));

   错误原因在百度之后就已经知道--传说中的中文字符问题(一直是折腾人的问题,本人不是计算机出身,算是个半吊子的计算机程序员,对编码这个东西,还真搞不懂计算机是怎么工作的,望哪位大侠出来指点迷津^_^)!我的xml字符串头部信息为<?xml version="1.0" encoding="UTF-8"?>,而在处理的时候估计变成了GBK了(或者其他的编码..),但是始终不知道怎么解决。最后我那就想了个最笨的方法,那个就是试,那个给我试的啊!真那个叫心酸...
   尝试过将字符串转码--new String(xml.getBytes("utf-8"),"utf-8")...

   尝试过将字符串放入各种流(因为我发现直接用request.getInputStream()读取同样的XML字符串不会出错)然后试,结果我就发现了一种写法不会出错,那就是下面的语句:
    document= reader.read(new StringInputStream(xml));
    也不知道是啥原因...研究中!
    参考文章:点击..进入

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值