彼岸图网图片

最新推荐文章于 2024-07-19 00:57:59 发布

ticoAg

最新推荐文章于 2024-07-19 00:57:59 发布

阅读量2.2k

点赞数

分类专栏：入门

本文链接：https://blog.csdn.net/shy986161/article/details/109248429

版权

入门专栏收录该内容

2 篇文章 0 订阅

订阅专栏

逛的时候太太太太喜欢某张图了每日一次下下来的竟然还是位图尝试爬下来什么格式

import re
import requests
from bs4 import BeautifulSoup as bs
import os


def url_open(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36 LBBROWSER'}
    res = requests.get(url, headers=headers)
    return res


def findlinks(res):
    soup = bs(res.text, 'lxml')
    target = soup.find_all('ul', class_="clearfix")
    list = re.findall(r'href="(.*?\.html)"', str(target))
    return list


def find_img(list):
    urlhead = 'http://pic.netbian.com'
    img = []
    for each in list:
        img.append(urlhead + each)
    return img


def save_img(img):
    urlhead = 'http://pic.netbian.com'
    for each in img:
        res = url_open(each)
        soup = bs(res.content, 'lxml')
        link = re.findall(r'src="(/.*\.jpg)"', str(soup))
        url = urlhead + link[0]
        filename = url.split('/')[-1].replace('.html', '')
        img = url_open(url)
        with open(filename, 'wb') as f:
            f.write(img.content)


if __name__ == '__main__':
    # os.mkdir('彼岸图')
    os.chdir('彼岸图')
    url = 'http://pic.netbian.com/4kdongman/index.html'
    res = url_open(url)
    list = findlinks(res)
    img = find_img(list)
    save_img(img)