写下这一系列帖子是对我python学习过程的一个记录,也是对自己的一个督促。
正则表达式:
希望各位大神多多帮助,指出不足之处!
#coding=utf-8
import urllib
import re
def getHtml(url):
page = urllib.urlopen(url);
html = page.read();
return html;
def getImage(html):
reg = r'src="(.+?\.jpg)"';
imgre = re.compile(reg);
imglist = re.findall(imgre,html);
x = 0;
for imgurl in imglist:
urllib.urlretrieve(imgurl,"%s" % x);
x+=1;
return imglist;
html = getHtml("http://tieba.baidu.com/p/xxxx");
print getImg(html);
正则表达式: