全程使用BeautifulSoup完成
简述思路后直接上代码
首先我们观察发现该网站的基盘网址主要分为翻页与type两大部分,对于翻页可直接用for循环解决,但是type这一块我们发现实际只包含了header热门关键词的跳转链接,对于查询类需要重新进行更新,还有一个难点就是全屏的full更small之间的跳转,所以在进行简单观察后笔者选择用replace进行规律化替换,从而使最终的结果标准化,最后一个棘手的问题便是,该基盘网站的png与jpg存放类型的交替化导致结果不理想,所以笔者采用通过status_code进行返回结果判断,从而更新处理url。(至于定位与获取则通过beautifulsoup解决,正则,xpath亦可,)
代码:
# -*- coding: utf-8 -*-
"""
Spyder about hot WallPaper
@author by 天玄本玄
"""
import requests
from bs4 import BeautifulSoup
class spyder_wallheavn