4k图片爬取

爬虫

import requests
import os
from lxml import etree
# 创建文件夹
try:
    os.mkdir('./4k动物爬取')
except Exception:
    print('文件已创建!')
for i in range(2,172):
    i = str(i)
    #目录页面
    ml_url = 'https://pic.netbian.com/4kdongwu//index_' + i + '.html'
    # UA伪装请求头
    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chromeh/81.0.4044.138 Safari/537.36'
    }
    response = requests.get(url=ml_url,headers=header)
    #通用处理中文乱码的解决方法
    res=response.text.encode('iso-8859-1')
    treee = etree.HTML(res)
    t = treee.xpath('//div[@class="slist"]/ul/li')
    for tu in t:
        http = 'http://pic.netbian.com'
        #标题
        tit = tu.xpath('./a/img/@alt')[0]
        #地址
        tp = http + tu.xpath('./a/img/@src')[0]
        img = requests.get(url=tp,headers=header).content
        imgpath = './4k动物爬取/' + tit + '.jpg'
        with open(imgpath, 'wb') as fp:
            #传入二进制内容
            fp.write(img)
            print(tit,'下载成功!')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值