python网络爬虫,抓取网页图片

今天写了个实例,用于抓取网页中的图片,要保证抓取到自己想要的图片

首先图片需要遵循一定的规则

<span style="font-size:14px;">#-*-coding:utf-8 -*-

import re
import urllib

def get_content(url):                            #获取图片网页的源代码
	'''doc,'''
	html=urllib.urlopen(url)
	content=html.read()
	html.close()
	return content



def get_images(info):
	'''doc,
 <img class="BDE_Image" src="http://imgsrc.baidu.com/forum/w%3D580/sign=1b143d447f899e
 51788e3a1c72a6d990/a65049086e061d952495d9817ff40ad163d9ca0d.jpg"
	'''
	regex=r'class="BDE_Image" src="(.+?\.jpg)"'               #正则表达式,定义图片规则

	pet=re.compile(regex)<span style="white-space:pre">					</span>  #编译python加快速度

	Image_code=re.findall(pet,info)

	l=0
	for image_url in Image_code:
		print image_url

		urllib.urlretrieve(image_url,'%s.jpg' %l)           #重命名循环输出图片
		l+=1
	print len(Image_code)
info= get_content("http://tieba.baidu.com/p/2772656630")
print get_images(info)	
</span>


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

互联网极客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值