python桌面爬虫_爬虫项目实战十三:爬取zol桌面壁纸

目标

爬取zol桌面壁纸,批量下载图片。

项目准备

软件:Pycharm

第三方库:requests,fake_useragent,re,lxml

网站地址:http://desk.zol.com.cn/1920x1080/

项目分析

打开网站看一下。

e6fab5986d0a6a11d3dddbd7e0195ea9.png

030d6d9bf4b48f66552eb02748ae7b8b.png

每一个都是一个图集。

点开

a5f41370432f35d04ed89a8f7aa94f83.png

55d5173f3603258bece21e70add5b6ec.png

查看源代码

c602b13464092302ce9370ab45ea6e4a.png

可以看出每一个都可以在源代码中找到。判定为静态网页。

页码分析

第一页url链接:http://desk.zol.com.cn/1920x1080/1.html

第二页url链接:http://desk.zol.com.cn/1920x1080/2.html

第三页url链接:http://desk.zol.com.cn/1920x1080/3.html

可以发现每一页随着后面的数字而变化。

4eeb15dab5e9d758458ceea62dfb45e5.png

反爬分析

同一个ip地址去多次访问会面临被封掉的风险,这里采用fake_useragent,产生随机的User-Agent请求头进行访问。

代码实现

1.导入相对应的第三方库,定义一个class类继承object,定义init方法继承self,主函数m

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值