使用Scrapy爬取图片

最新推荐文章于 2021-04-16 16:11:56 发布

weixin_43289228

最新推荐文章于 2021-04-16 16:11:56 发布

阅读量397

点赞数 1

分类专栏： scrapy学习文章标签： python

本文链接：https://blog.csdn.net/weixin_43289228/article/details/107979257

版权

本文介绍了如何使用Scrapy框架爬取美食杰网站上的川菜菜谱图片。首先分析网址结构，接着配置items.py定义爬取内容，设置pipelines.py实现图片下载，再在settings.py中调整相关参数，最后运行scrapy爬虫。

摘要由CSDN通过智能技术生成

分析网址

网址地址：美食杰-川菜.
我们需要爬取网站上的菜谱图片，分析网址结构如下：

#在命令行中运行
scrapy shell "https://www.meishij.net/china-food/caixi/chuancai/"
#可以发现我们想要爬取的图片src地址位于：
picture_src = response.xpath('/html/body/div[6]/div/div[3]/div[2]/div[1]/div//@src')
#图片标题位置位于：
picture_title = response.xpath('/html/body/div[6]/div/div[3]/div[2]/div[1]/div//@title')

接下来就可以展开爬取工作了

配置Scrapy

首先要生成scrapy，在命令行中运行

scrapy startproject meishijieSpider
cd meishijieSpider
scrapy genspider meishijie

进入文件开始配置具体工作

配置items.py

我们只需要爬取图片名称和下载链接，所以：

import scrapy

class MeishijiespiderItem(scrapy.Item):
    name = scrapy.Field()
    src = scrapy.Field()

##配置meishijie.py
进入spiders文件夹，打开meishijie.py，首先导入之前定义的item，并写好初始爬取url：

import scrapy
from ..items import MeishijiespiderItem
import time

最低0.47元/天解锁文章

weixin_43289228

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
使用Scrapy爬取图片

使用Scrapy爬取图片分析网址配置Scrapy配置items.py设置pipelines.py设置settings.py运行scrapy分析网址网址地址：美食杰-川菜.我们需要爬取网站上的菜谱图片，分析网址结构如下：#在命令行中运行scrapy shell "https://www.meishij.net/china-food/caixi/chuancai/"#可以发现我们想要爬取的图片src地址位于：picture_src = response.xpath('/html/body/div[
复制链接

扫一扫