小代码:
抓取的是百度贴吧的图片,抓的是风景图;要是抓取妹子,换一个妹子贴就行。。
# -*- coding:utf-8 -*-
import re
import urllib
def getHtml(url):
"""
返回整个页面
"""
html=urllib.urlopen(url)
page=html.read()
html.close()
return page
def getImg(info):
"""
点击要下载图片审查元素,用这则匹配要下载的图片
<img class="BDE_Image" src="http://imgsrc.baidu.com/forum/w%3D580/sign=d54ed223364e251fe2f7e4f09787c9c2/3325f8faaf51f3de20f5c97d92eef01f3a297913.jpg"
pic_ext="jpeg" changedsize="true" width="560" height="374">
"""
regex = r'class="BDE_Image" src="(.+?\.jpg)"'
pat=re.compile(regex)
images_code = re.findall(pat,info)
i=1
for image_url in images_code:
print image_url
urllib.urlretrieve(image_url,'%s.jpg'%i)
i+=1
url="http://tieba.baidu.com/p/3910307825"
info=getHtml(url)
print getImg(info)
右键图片审查元素:
抓取的图片: