# -coding: utf-8
imoprt urllib2
import urllib
import re
# 填写需要采集的网址
urlPath = '
# 设置网页头部信息,模拟浏览器
headers = {'User-Agent' : agent, 'Accept' : '*/*', 'Referer' : 'http://www.google.com'}
# 打开网页,并读取网页源码
request = urllib2.Request(urlPath, headers=headers)
response = urllib2.urlopen(request)
html = response.read()
# 构建图片标签正则表达式
img=re.compile(r"""""",re.I)
# 保存的图片名称和路径,需要自己设置
path = '~/Code/Python/img_splider/'
try:
# 使用正则匹配出所有的img标签
img_list = re.findAll(img, html)
# 遍历得到的所有标签,然后进行下载
for i in xrange(length(img_list)):
# 使用urllib读取打开图片
data = urllib.urlopen(img_list[i]).read()