Python爬百度图片框架(初级)

'''
    爬取百度图片初级框架:

        使用方法(参数):
            url --- 要爬取的百度图片域名(字符串)
            page --- 爬取的页数(int)
            src  --- 存放的图片路径(字符串的形式)

        一共有两个函数:
            getImg       --- 可以批量下载百度多张页面的图片
            getImgPage   ---  指定下载百度某张页面,只能下载一个页面的图片
'''
import requests
import re
import pprint

index = 0

#获取百度图片函数
def getImg(url,page,src):
    global index
    #变换地址(重要)
    url = url.replace('index','flip')
    rs = re.findall(r'http(.*?)pn',url)
    url = 'http'+rs[0]+'pn='
    #获取头部信息
    res = requests.get(url)
    #显示访问状态
    print('状态:'+str(res.status_code))
    hear =  res.headers
    #循环获取图片
    for k in range(0, page):
        print('第{}页'.format(k+1))
        Res = requests.get(url+'{}'.format(index), hear).text
        r = re.findall(r'{.+?"objURL":"(.+?)".+?}', Res)
        pprint.pprint(r)
        index = index + 20
        #保存图片
        for j in range(len(r)):
            get_res = requests.get(r[j])
            with open('{}/{}m.jpg'.format(src,j),'+wb') as f:
                f.write(get_res.content)

#获取百度第几页的图片函数
def getImgPage(url,page,src):
    if(page == 1):
        page = 0
    else:
        page = (page-1)*20
    # 变换地址(重要)
    url = url.replace('index', 'flip')
    rs = re.findall(r'http(.*?)pn', url)
    url = 'http' + rs[0] + 'pn='
    # 获取头部信息
    res = requests.get(url)
    # 显示访问状态
    print('状态:' + str(res.status_code))
    hear = res.headers

    # 获取图片
    Res = requests.get(url + '{}'.format(page), hear).text
    r = re.findall(r'{.+?"objURL":"(.+?)".+?}', Res)
    pprint.pprint(r)
    # 保存图片
    for j in range(len(r)):
        get_res = requests.get(r[j])
        with open('{}/{}m.jpg'.format(src, j), '+wb') as f:
            f.write(get_res.content)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

冒险岛_0_

您的打赏是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值