元气动态壁纸爬虫(入门)

最新推荐文章于 2023-12-21 14:45:26 发布

南乔Avo

最新推荐文章于 2023-12-21 14:45:26 发布

阅读量3.4k

点赞数 2

分类专栏： python爬虫文章标签： python

本文链接：https://blog.csdn.net/weixin_46277390/article/details/119275058

版权

本文介绍如何使用Python进行元气动态壁纸的爬取，涉及到线程和协程（yield关键字）的应用，适合初学者入门。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

线程

import requests
from lxml import etree
import threading
from queue import Queue

pageUrlQueue = Queue()
downloadQueue = Queue()

def parsePageUrl(pages):
    for page in range(1,pages+1):
        url = "https://bizhi.ijinshan.com/dtag_109/index_"+str(page)+".shtml"
        print(url)
        headers = {
            "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.55",
            "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
        }
        res = requests.get(url=url,headers=headers)
        res.encoding = res.apparent_encoding
        html = etree.HTML(res.text)

        divs = html.xpath("//div[@class='wallpaper-wrapper