python爬取好看的小姐姐壁纸

一般来说很多人在学会爬虫之后会去妹子图这个网站爬取一些套图来作为练习,但是最近这个网站有了反爬而且套图无法下载,在经过好长一段时间的搜寻过后,我发现了一个新的网站:http://www.win4000.com/meinvtag4_1.html

首先导入必要的包:

import requests
from bs4 import BeautifulSoup
import re
import time
import os

获取套图的链接和标题

headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0"
    }
def geturl():
    original_code = re.compile(r'<a href="(.*?)" target="_blank">')
    title_code = title_code = re.compile(r'<img alt="(.*?)" data-original')
# URL = 'http://www.win4000.com/meinvtag4_1.html'
    html_url = []
    title = []
    for i in range(1,6):
        URL = 'http://www.win4000.com/meinvtag4_%d.html'%i
        session = requests.Session()
        response = session.get(URL,headers = headers)
        page_code = response.text
        soup = BeautifulSoup(page_code,'html.parser')
        for item in soup.find_all('div', class_="Left_bar"):
            item = str(item)
            html_url = html_url + re.findall(original_code,item)
            title = title + re.findall(title_code,item)
    return html_url,title

html_url,title = geturl()

保存套图

savepath = '.\\bizhi'
pic_code = re.compile(r'data-original="(.*?)" src')
for  i in range(len(html_url)):
    pic_url = []
    url = html_url[i]
    session = requests.Session()
    response = session.get(url, headers=headers)
    page_code = response.text
    soup = BeautifulSoup(page_code, 'html.parser')
    for item in soup.find_all('div', class_="scroll-img-cont scroll-img-cont02"):
        item = str(item)
        pic_url += re.findall(pic_code, item)
        temppath = savepath + '\\%s' % title[i]
        os.makedirs(temppath)
    for j in range(len(pic_url)):
        path = temppath + '\\%d.jpg' % (j + 1)
        temp = pic_url[j][0:-12] + pic_url[j][-4:]
        response = session.get(temp, headers=headers)
        f = open(path, 'wb')
        f.write(response.content)
        f.close()
    print('已经处理好第%d组'%(i+1))
    print('休息一下')
    time.sleep(0.3)
效果展示

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

百度云链接

在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值