最近写不同项目之间socket 通讯 传递xml 方式进行业务交互, 在解析对方xml时,经常出现 xml设置的编码和 文件中中文的编码不一致,导致加载失败,报异常的问题。
我遇到的是报2中错误,
1. Nested exception: no protocol:
2.Invalid byte 1 of 1-byte UTF-8 sequence. Nested exception: Invalid byte 1 of 1-byte UTF-8 sequence.
这2中都是 xml中申明的 编码 和内容中的编码不一致导致的。
第二种错误,我用了 xmlString = xmlString.replaceAll("UTF-8", "GBK"); 的方式,偷懒解决了问题,
但是第一种错误 用这种方法就没有办法解决了。
所以寻求了另一中解决方案。
SAXReader reader = new SAXReader();
Document document = reader.read(new InputSource(new ByteArrayInputStream(xmlString.getBytes("utf-8"))));
或者
Document document = reader.read(new ByteArrayInputStream(xmlString.getBytes("utf-8")));
xmlString 是我方法中传递过来需要解析的 xml 字符串;
用这种成功解决了第一种报错方式, 这种方法应该也实用余其他解析方式。