用python正则表达式提取网页的url超链接

用python正则表达式提取网页的url

import re
import urllib
url="http://www.baidu.com"
s=urllib.urlopen(url).read()
ss=s.replace(" ","")
urls=re.findall('<a.*?href=.*?<\/a>',ss,re.I) 
for i in urls:
    print i
else:
    print '显示完成'
#urls=re.findall(']*?href=.*?<\/a>',ss,re.I)

原文链接:添加链接描述

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
©️2022 CSDN 皮肤主题:大白 设计师:CSDN官方博客 返回首页
评论
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值