去除:
String content = "<p><strong>啊啊啊。</strong></p><p><mark class="marker-yellow">不不不不</mark><s>不</s>,<i>发</i></p>"
// <p>段落替换为换行
content = content.replaceAll("<p .*?>", "\r\n");
// <br><br/>替换为换行
content = content.replaceAll("<br\\s*/?>", "\r\n");
// 去掉其它的<>之间的东西
content = content.replaceAll("\\<.*?>", "");
System.out.println(content);
结果:
需要清除富文本格式,找了一篇文章。感觉很好记录下。
原文地址