代码
import re
import urllib
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImage(html):
r1=r'img class="BDE_Image" src="(.*?\.jpg)"' #?最小匹配
r1=re.compile(r1)
imglist=re.findall(r1,html)
print imglist
x=0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' % x)
x+=1
html=getHtml('http://tieba.baidu.com/p/2826139361') #放入网页url
getImage(html)
正则 .*? 用法
最小匹配 若.*\. 则匹配tool.chinaz.