爬取堆糖蜜桃猫图片并下载到本地

爬去蜜桃猫

大家可以打开堆糖网,不需要登录,然后搜索蜜桃猫,就会发现许多可爱的蜜桃猫和他的小对象,我们这次的任务就是要爬取蜜桃猫的日常生活。下面是爬取的代码,我们先提取了每个图片的链接,然后进行了下载。由于搜索到的结果是Ajax,所以需要我们通过json库来进行爬取。然后用正则表达式来为每个图片创建自己的名称。最后进行保存。

import requests
import re
from requests.exceptions import MissingSchema
import json
url = []
def get_page():

    url = 'https://www.duitang.com/napi/blog/list/by_search/?kw=%E8%9C%9C%E6%A1%83%E7%8C%AB&type=feed&start=0&limit=100'

    try:
        resp = requests.get(url)
        #print(url)
        if 200  == resp.status_code:
            #print(resp.json())
            return( resp.json())
    except requests.ConnectionError:
        return None


def get_images(json):

    if json.get('data'):
        data = json.get('data')
        #print(data)
        object_list = data.get('object_list')
        for list in object_list:
            image2 = list.get("photo")
            images = image2.get("path")
            save_image(images)



def save_image(url):


    response = requests.get(url)
    picture = response.content
    "https://b-ssl.duitang.com/uploads/item/201903/13/20190313105834_vtvmt.jpeg"
    abc = re.match("^http.*?_(.*?)$",str(url))
    #print("aa")
    #print(abc.group(1))
    num = abc.group(1)
    path = "d:/py/duitangmitaomao/p/"+str(num)
    with open(path, "wb") as f:
        f.write(picture)






def main():

        json = get_page()
        get_images(json)
        save_image(url)

main()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Watermelon,

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值