【爬虫】使用pyspider爬取壁纸

文章参考:

https://blog.csdn.net/wangjx92/article/details/78903288

 

这次爬取的是必应的每日壁纸

如何使用请看这里

   1.先分析一下Url:

    https://bing.ioliu.cn/?p=1

    发现只要更改p的参数就可以进入相应的页数。

    而且有多少页都已经标好了,微软真是贴心啊。

    2.接下来获取每个图片详情页的url。

    3.进入页面之后找到图片的地址然后下载下来。

 

4.以下是代码:

validate_cert确定是否验证证书,这个每个crawl()方法都要加不如就会出现以下问题

fetch_type开启phantomJS渲染。遇到JavaScript渲染的页面,指定此字段即可实现phantomJS的对接,pyspider将会使用phantomJS进行网页的抓取。

save可以在不同的方法之间传递参数。

真实图片链接后面有个“filter: blur(0px);”,查百度说是对图片的模糊处理。

window创建文件时文件名里不能有“/”,这里替换为空格。

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值