在使用dom4j解析xml文件的时候,会出现xml文件中的\t字符解析之后被转成空格字符的情况,如下图
这是待解析的xml文件:里面含有\t 字符
如果不进行任何处理,解析出来的结果就是这样的:(\t 被解析成为asc码为32的空白字符了,这显然不是我们想要的)
解决办法:
使用xml字符实体,在dom4j解析之前把\t转换成字符实体,\t对应字符实体为	
在xml里面其他部分不含\t的情况下,可以把xml字符串整体替换:
xml = xml.replaceAll("\t" , "	");
这样就可以了,解析结果如下: