1. /**
2. * 删除input字符串中的html格式
3. *
4. * @param input
5. * @param length
6. * @return
7. */
8. public static String splitAndFilterString(String input, int length) {
9. if (input == null || input.trim().equals("")) {
10. return "";
11. }
12. // 去掉所有html元素,
13. String str = input.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll(
14. "<[^>]*>", "");
15. str = str.replaceAll("[(/>)<]", "");
16. int len = str.length();
17. if (len <= length) {
18. return str;
19. } else {
20. str = str.substring(0, length);
21. str += "......";
22. }
23. return str;
24. }
新闻内容或者博客文章,如果显示摘要,需要去除内容的html格式标签,找到一个正则表达式,实现了: