Python 实现下载图片的主要模块主要有:
(1)urllib2:主要实现网页的读取工作
(2)re :主要实现网页源码中查找所有的图片位置
版本:Python 2.7.11
过程说明:
(1)打开网址,读取源码
(2)使用正则表达式,提取所有的图片链接
(3)将图片链接保存。
代码如下:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import urllib2
import re
'''
使用utllib2,打开网址,读取源码内容。
'''
req = urllib2.urlopen('http://www.imooc.com/course/list?c=python')
buf = req.read()
'''
正则表达式,读取源码中出现的图片的链接
'''
p = re.compile(r'http:.+\.jpg')
listurl = p.findall(buf)
print listurl
'''
根据图片的链接列表,进行保存。
'''
i = 0
for item in listurl:
imgPath = 'd:/tmpfile/img/' + str(i) + '.jpg'
f = open(imgPath, 'ab')
imgreq = urllib2.urlopen(item)
imgbuf = imgreq.read()
f.write(imgbuf)
f.close()
i += 1
总结:
(1)简单使用正则表达式的例子,其他正则表达式的说明,请参考
http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html
(2)使用utllib2的例子,具体说明,请参考:
http://wenku.baidu.com/view/16547c2abd64783e09122bfc.htm