对于网络编程中获取到的网页HTML文档,可以用“<.*?>"这一段正则删除<>中的所有内容,包括<>. java中使用 html.replaceAll("<.*?>", ""); 就能实现网页内容的提取