爬虫学习-第一弹-批量下载二次元好图

本文介绍了使用Python进行爬虫操作,批量下载二次元壁纸的过程。重点包括二进制文件写入时指定格式,正确设置URL,爬取策略以及如何持久化存储图片。通过伪装UA,确定目标网站并进行爬取,将图片存储到指定目录,让学习变得充满乐趣。
摘要由CSDN通过智能技术生成

图片网址:/ | konachan.net - Konachan.com Anime Wallpapers

import requests
import re
import os

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 Edg/92.0.902.67"
}

message = input('enter the name of your wife!')
pages = input("How many pages?")
if not os.path.exists(f'./{message}Libs'): 
    os.mkdir(f'./{message}Libs') 

for page in range(1,int(pages)+1):
    para = {
        'page': page,
        'tags': message,
    }
    url = f'https://konachan.net/post?page={page}&tags={message}'
    page_text = requests.get(url = url, headers= headers).text
    ex ='<a class="directlink largeimg" href="(.*?)">'
    img_scr_list = re.find
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值