经常需要从网络上抓取一些HTML信息,然后就需要处理HTML为纯文本格式 more="<html> <body>asdf<br> sadfasdf</body></html>"; more = more.replaceAll("<(.*?)>", " ");//清除所有HTML标签 现在的more就是一个纯文本格式的字符串了 |
经常需要从网络上抓取一些HTML信息,然后就需要处理HTML为纯文本格式 more="<html> <body>asdf<br> sadfasdf</body></html>"; more = more.replaceAll("<(.*?)>", " ");//清除所有HTML标签 现在的more就是一个纯文本格式的字符串了 |