Python爬虫:爬取某鱼颜值主播图片并保存到本地升级版!

本文介绍了如何使用Python的Scrapy框架爬取斗鱼平台的颜值主播图片。通过分析请求链接,提取JSON数据中的主播名称和图片URL,实现了将图片保存到本地的功能。完整代码包括Spider、Pipeline和设置,实现了多页爬取及图片重命名。
摘要由CSDN通过智能技术生成

一、准备

1.创建scrapy项目

scrapy startproject douyu

cd douyu

scrapy genspider spider "www.douyu.com"
12345

2.创建启动文件start.py

from scrapy import cmdline

cmdline.execute("scrapy crawl douyu".split())
123

二、分析

准备完毕,开始分析。先进入斗鱼看看。

找到发送的请求


可以看到页面的数据都在其中


而请求的链接为


访问该网址


这么看数据可能不太好分析,复制数据使用在线json进行格式化校验


本次项目中要获取的是主播名称和图片url,分析json数据如下:

我们需要的数据位置:

OK,接下来分析代码

class DouyuSpider(scrapy.Spider):

name = 'douyu'

# allowed_domains = ['www.douyu.com']

#直接访问我们刚才找到的链接

start_urls = ['https://www.douyu.com/gapi/rknc/directory/yzRec/1']

offset = 1 #爬取多页限制条件

def parse(self, response):

#通过对json的分析,名称和图片都在rl下,我们直接拿到data下的rl进行遍历获取

data_list = json.loads(response.body)["data"]["rl"]

for data in data_list:

nn = data["nn"] #拿到名称

img_url = data["rs1"] #拿到图片url

item = DouyuItem(nn=n

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值