Python爬虫,爬取二次元萌妹图片(可自由设定图片像素)

本文介绍如何使用Python爬虫抓取二次元萌妹图片。通过请求服务器获取网页,利用正则表达式解析图片URL,将图片保存在临时文件夹,并筛选特定像素的图片至指定文件夹。由于目标网站已关闭,实际操作可能无法进行。
摘要由CSDN通过智能技术生成

原理

通过request获得服务器返回的网址,再使用re正则表达式筛选出图片的地址。
然后将图片下载在一个临时文件夹筛选出符合要求的图片,返回到指定文件夹下。
(ps:目前着迷网已经关停了,不知道还能不能爬到数据)

源代码

在这里插入代码#encoding=utf-8

import requests
import os
import re
import shutil
from PIL import Image
import tkinter
from tkinter import filedialog
import time

#筛选达到指定像素的图片
def select(path):
    try:
        im = Image.open(path)
        im_height = im.size[1]
        im_width = im.size[0]
        if not (im_width>1000 and im_height>1000):#判断图片的像素是否达到im_width和im_height的要求
            im.close()
            os.remove(path)
            print("The Pictrue is Fuzziness!!!")
    except(OSError 
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值