python爬取壁纸教程01 --wallheaven

因为写博客总喜欢配些高质量的美图,鉴于惰性,不想去网上找各种素材,于是利用爬虫获取了一批壁纸到本地,以下是抓取的网址:https://wallhaven.cc/,具体代码实现如下 :

#-- coding:utf-8 --

import requests
from  lxml import etree

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:64.0) Gecko/20100101 Firefox/64.0"
}

filepath = "C:\\Users\金少\Desktop\壁纸\wallhaven"  # 文件路径

for i in range(1, 20):  # 爬取页数
    kv = {"page": i}

    url = "https://wallhaven.cc/toplist"
    try:
        r = requests.get(url, headers=headers, params=kv, timeout=20)

        # 开始解析
        html = etree.HTML(r.text)
        srcs = html.xpath(".//li//a[@class='preview']/@href")  # 获取到跳转网页

        for src in srcs:
            r = requests.get(src, headers=headers, timeout=20)
            html = etree.HTML(r.text)
            img_src = html.xpath(".//img[@id='wallpaper']/@src")
            for src in img_src:
                filename_1 = src.split('/')[-1]  # 获取文件名
                response = requests.get(src, headers=headers)

                with open(filepath + filename_1, 'wb') as file:
                    file.write(response.content)
                    print(filename_1)
                print("Succeed")

    except:
        continue
        print("跳过")
print("Triumph")

抓取的图片分享百度云链接如下:高清壁纸 提取码:0z07

以下是壁纸鉴赏环节:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值