代码示例 import re def clear_html_re(src_html): ''' 正则清除HTML标签 :param src_html:原文本 :return: 清除后的文本 ''' content = re.sub(r"</?(.+?)>", "", src_html) # 去除标签 # content = re.sub(r" ", "", content) dst_html = re.sub(r"\s+", "", content) # 去除空白字符 return dst_html