python过滤去除html标签 提取纯文本
python正则过滤html标签,提取纯文本上代码def filterHtmlTag(htmlstr): ''' 过滤html中的标签 ''' #兼容换行 s = htmlstr.replace('\r\n','\n') s = htmlstr.replace('\r','\n') #规则 re_cdata = re.compile('//<!\[CDATA\[[^>]*//\]\]>',re.I) #匹配CDATA re_script = re
原创
2020-08-03 13:59:30 ·
2502 阅读 ·
0 评论