使用dom4j解析xml文件时遇到一个怪问题。
从接口里返回一个xml文件,来解析,xml的编码为gb2312,直接解析流会报org.dom4j.DocumentException: Error on line 1 of document : 字符转换错误:“Unconvertible UTF-8 character beginning with 0xb5”(行号可能太小)。 Nested exception: 字符转换错误:“Unconvertible UTF-8 character beginning with 0xb5”(行号可能太小)。这个错误,但是如果把他存为文件再解析就没问题,真奇怪。
解决,通过 reader.setEncoding(encoding); 解决掉这个问题,看样子就是编码的问题。
但是,奇怪的是又来了,查看SAXReader的api发现其支持read(String url),通过这个来解析reader.setEncoding(encoding)不起作用,仍然报之前的异常,没空去分析他了,哪位遇到过帮忙解释一下:)