python正则表达式去除html标签

最新推荐文章于 2023-08-16 10:17:52 发布

zhanghaipeng1989

最新推荐文章于 2023-08-16 10:17:52 发布

阅读量5.8k

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/zhanghaipeng1989/article/details/41644523

版权

Python 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

使用python的re模块，正则表达式去除html标签，代码如下：

import re

html = '<pre class="line mt-10 q-content" accuse="qContent">\
目的是通过第一次soup.find按class粗略筛选并通过soup.find_all筛选出列表中的a标签并读入href和title属性<br><br>\
但是由于目标链接可能有图片链接,而这是我不想要的.请问如何去除?<br></pre>'

reg = re.compile('<[^>]*>')

print(reg.sub('',html))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zhanghaipeng1989

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
python正则表达式去除html标签

使用python的re模块，正则表达式去除html标签，代码如下：import rehtml = '\目的是通过第一次soup.find按class粗略筛选并通过soup.find_all筛选出列表中的a标签并读入href和title属性\但是由于目标链接可能有图片链接,而这是我不想要的.请问如何去除?'reg = re.compile(']*>')print(reg.sub(
复制链接

扫一扫