问题产生:
在接口调用得出一个xml型字符串,一直报错
The entityname must immediately follow the '&' in the entity reference
经查发现 xml的内容里存在有 &符号 而 通过dom4j读取时 会发生错误
在xml中 “&”“<”“>”这样的标签存放在内容里是不合法的,会经常出问题。
下面找到解决方法:实测 替换 & 是可行的。
public
void
chartReplace(){
String str2 =
"<logentry revision='1'>"
+
"<msg>In this comment, I fixed a <bug>, and <added> file1&&file2.</msg>"
+
"</logentry>"
;
System.out.println(
"original string: "
+str2);
//替换“&”:$1表示与(<msg>.*)的匹配子序列;$4表示与(.*</msg>)匹配的。
//&(?!amp;)表示匹配&而且后面不是amp;的字符串
//"$1&$3$4"得到的结果就是替换了<msg></msg>中的“&”为“&”
//由于每次只能替换掉一个“&”,所以循环执行替换,直到替换后与替换前的字符串相等。
String str1 =
""
;
while
(!str2.equals(str1)){
str1 = str2;
str2 = str1.replaceAll(
"(<msg>.*)(&(?!amp;))(.*</msg>)"
,
"$1&$3"
);
}
System.out.println(
"firstly replace \"&\": "
+str2);
//替换“<”
str1 =
""
;
while
(!str2.equals(str1)){
str1 = str2;
str2 = str1.replaceAll(
"(<msg>.*)(<)(.*</msg>)"
,
"$1<$3"
);
}
System.out.println(
"then replace \"<\": "
+str2);
//替换“<”
str1 =
""
;
while
(!str2.equals(str1)){
str1 = str2;
str2 = str1.replaceAll(
"(<msg>.*)(>)(.*</msg>)"
,
"$1>$3"
);
}
System.out.println(
"finally replace \">\": "
+str2);
}
|
感谢
http://my.oschina.net/u/178218/blog/55293