一键抓取史上最牛 wall paper ----wallhaven

置顶 Alexander plus

于 2020-09-22 15:11:25 发布

阅读量1.6k

点赞数

分类专栏： spider大集合 python 文章标签： python spyder devops tooling

本文链接：https://blog.csdn.net/Tianxuancsdn/article/details/108732215

版权

spider大集合同时被 2 个专栏收录

20 篇文章 8 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

python

8 篇文章 0 订阅

订阅专栏

全程使用BeautifulSoup完成

简述思路后直接上代码
- 代码：
- 结果：

简述思路后直接上代码

首先我们观察发现该网站的基盘网址主要分为翻页与type两大部分，对于翻页可直接用for循环解决，但是type这一块我们发现实际只包含了header热门关键词的跳转链接，对于查询类需要重新进行更新，还有一个难点就是全屏的full更small之间的跳转，所以在进行简单观察后笔者选择用replace进行规律化替换，从而使最终的结果标准化，最后一个棘手的问题便是，该基盘网站的png与jpg存放类型的交替化导致结果不理想，所以笔者采用通过status_code进行返回结果判断，从而更新处理url。（至于定位与获取则通过beautifulsoup解决，正则，xpath亦可，）

代码：

# -*- coding: utf-8 -*-
"""
Spyder about hot WallPaper
@author by 天玄本玄
"""

import requests
from bs4 import BeautifulSoup

class spyder_wallheavn

了解本专栏

超级会员免费看

Alexander plus

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
一键抓取史上最牛 wall paper ----wallhaven

全程使用BeautifulSoup完成简述思路后直接上代码新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入简述思路后直接上代码首先我们观察发现该网站的基盘网址主要分为翻页与type两大部分，对于翻页可直接用for循环解决
复制链接

扫一扫