python扒静态网页图片

拿扒东北大学官网的图片为例:

#coding=utf-8  
import re  
import urllib2
import time  
url = urllib2.urlopen('http://www.neu.edu.cn/')  
buf = url.read()  
more = re.compile(r'<img src=\"(.*\.(jpg|png|jpeg))\"')  
abc = more.findall(buf)  
base = 'http://www.neu.edu.cn/'
img = [base+i[0] for i in abc]
for tmp in img:
    data = urllib2.urlopen(tmp).read()
    filename = './img/'+tmp[tmp.rfind('/')+1:]
    print filename
    with open (filename, 'wb') as fw:
        fw.write (data)
    time.sleep (1)
阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/morejarphone/article/details/74531221
个人分类: python学习
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭