s = s.replace('\r\n', '').replace(' ', '').replace('\xa0', '').replace('\t', '').replace('\u3000', '')
import re
re.sub(r'<.*?>', "", s)
正则方式提取html格式的文本内容
最新推荐文章于 2023-11-26 00:42:28 发布
s = s.replace('\r\n', '').replace(' ', '').replace('\xa0', '').replace('\t', '').replace('\u3000', '')
import re
re.sub(r'<.*?>', "", s)