可以使用Python中的正则表达式来去除html标签,示例代码如下:
import re
text = '<p>你好吗:</p><p><strong>1.你好吗;</strong></p><p><strong>2.你好吗;</strong></p><p><strong>3.你好吗;</strong></p><p><strong>4.你好吗;</strong></p><p>你好吗。</p>'
# 使用正则表达式去除html标签
result = re.sub('<[^>]+>', '', text)
print(result)
这里使用re.sub()
函数,将所有html标签替换为空字符串,最后输出去除html标签的纯文本。