用python正则表达式提取网页的url超链接

最新推荐文章于 2024-07-04 16:04:39 发布

xuedingeca

最新推荐文章于 2024-07-04 16:04:39 发布

阅读量4.3k

点赞数 3

分类专栏： Python 文章标签： python 正则表达式

原文链接：https://www.oschina.net/code/snippet_782578_14041

版权

Python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

用python正则表达式提取网页的url

import re
import urllib
url="http://www.baidu.com"
s=urllib.urlopen(url).read()
ss=s.replace(" ","")
urls=re.findall('<a.*?href=.*?<\/a>',ss,re.I) 
for i in urls:
    print i
else:
    print '显示完成'
#urls=re.findall(']*?href=.*?<\/a>',ss,re.I)

原文链接：添加链接描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xuedingeca

关注关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
用python正则表达式提取网页的url超链接

用python正则表达式提取网页的urlimport reimport urlliburl="http://www.baidu.com"s=urllib.urlopen(url).read()ss=s.replace(" ","")urls=re.findall('<a.*?href=.*?<\/a>',ss,re.I) for i in urls: print ielse: print '显示完成'#urls=re.findall(']*?href=.*
复制链接

扫一扫