用python正则表达式提取网页的url
import re
import urllib
url="http://www.baidu.com"
s=urllib.urlopen(url).read()
ss=s.replace(" ","")
urls=re.findall('<a.*?href=.*?<\/a>',ss,re.I)
for i in urls:
print i
else:
print '显示完成'
#urls=re.findall(']*?href=.*?<\/a>',ss,re.I)
原文链接:添加链接描述