import re
r=requests.get('https://www.baidu.com')
r.encoding="utf-8"
b=r.text
res=re.findall('<a.*?>(.*?)</a>',b)
print(res)
#输出为
['新闻', 'hao123', '地图', '视频', '贴吧', '登录', '登录', '更多产品', '关于百度', 'About Baidu', '使用百度前必读', '意见反馈']
Python使用正则提取网页中a标签的标题
最新推荐文章于 2024-07-20 17:12:48 发布