总体功能:下载百度贴吧网页的图片
这个例子延续了上一个抓取贴吧楼主发布内容的例子,上一个例子是把图片剔除掉了,这边重新做了一个下载图片的demo,比较简单。
代码:
# -*- encoding:utf-8 -*-
# 下载贴吧的图片
import re
import urllib
import urllib2
#下载百度贴吧图片类
class DownloadImg:
def getImage(self,Url):
request = urllib2.Request(Url)
response = urllib2.urlopen(request)
pattern = re.compile(r'<img class="BDE_Image" src="(.*?)" pic_ext=',re.S)
images = re.findall(pattern,response.read().decode("utf-8"))
name = 1
for img in images: