python手机壁纸超清_Python 爬取高清桌面壁纸

今天写了一个脚本用来爬取ZOL桌面壁纸网站的高清图片;

本程序只爬了美女板块的图片,若要下载其他板块,只需修改程序中的”meinv“即可

代码如下:

#coding=utf-8

import urllib

import re

import time

class Spider:

baseUrl='http://desk.zol.com.cn/'

pic_index=0

itemGroupPic=[]

def __init__(self,page_count):

time.sleep(1)

url=self.baseUrl+"meinv/1920x1080/"

for i in range(10, page_count):

time.sleep(5)

html=self.getHtml(url,i)

getbi=self.getPageImageGroup(html)

bizhi_url=self.getbizhiurlList(getbi)

def getHtml(self,url,page_index):

url=url+str(page_index)+".html"

page = urllib.urlopen(url)

html = page.read()

return html

def getPageImageGroup(self,html):

reg=r' imgre=re.compile(reg)

imagelist=re.findall(imgre,html)

return imagelist

def getbizhiurlList(self,imagelist):

for iurl in imagelist:

reg=r'bizhi/.*?.html'

imgre=re.compile(reg)

itmeimageurl=re.findall(imgre,iurl)

self.itemGroupPic.append(itmeimageurl)

def GetCurrentUrlAndDownload(self,url):

page = urllib.urlopen(url)

html = page.read() #read()出来的文本和网页右键源代码有点出入,这里需要优化

reg=r'.*.jpg

imgre=re.compile(reg)

urllist=re.findall(imgre,html)

for _u in urllist:

reg1=r'http://.*.jpg'

imgre1=re.compile(reg1)

itmeimageurl=re.findall(imgre1,_u)

print u'正在下载'+str(self.pic_index)+u'图片'

#D:\PictureAvi目录要事先创建好

urllib.urlretrieve(itmeimageurl[0],'D:\PictureAvi\%s.jpg' % self.pic_index)

self.pic_index+=1

#获取当前页面的url,next_html

next_reg=r'

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值