使用Scrapy爬取豆瓣图片

濯君

于 2021-05-31 19:21:27 发布

阅读量746

点赞数 1

本文链接：https://blog.csdn.net/zzldm/article/details/117425949

版权

本文介绍如何利用Scrapy爬虫框架爬取豆瓣上特定影星，如莫妮卡·贝鲁奇的全部个人图片。从创建Scrapy项目到配置执行环境，再到分析HTML页面和编写spider、items、pipelines及settings，逐步解析爬取过程。

摘要由CSDN通过智能技术生成

使用Scrapy爬取豆瓣某影星的所有个人图片

以莫妮卡·贝鲁奇为例

在这里插入图片描述
一：首先我们在命令行进入到我们要创建的目录，输入 scrapy startproject banciyuan 创建scrapy项目

创建的项目结构如下
在这里插入图片描述
二：为了方便使用pycharm执行scrapy项目，新建main.py

from scrapy import cmdline

cmdline.execute("scrapy crawl banciyuan".split())

再edit configuration
在这里插入图片描述
然后进行如下设置，设置后之后就能通过运行main.py运行scrapy项目了

三：分析该HTML页面，创建对应spider

from scrapy import Spider
import scrapy

from banciyuan.items import BanciyuanItem


class BanciyuanSpider(Spider):
    name = 'banciyuan'
    allowed_domains = ['movie.douban.com']
    start_urls = ["https://movie.douban.com/celebrity/1025156/photos/"]
    url = "https://movie.douban.com/celebrity/1025156/photos/"

    def parse(self, response):
        num = response.xpath('//div[@class="paginator"]/a[last()]/text()').extract_first('')
        print(num)
        for i in range(int(num)):
            suffix = '?type=C&start=' + str(

最低0.47元/天解锁文章

濯君

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
3
评论
使用Scrapy爬取豆瓣图片

使用Scrapy爬取豆瓣某影星的所有个人图片以莫妮卡·贝鲁奇为例一：首先我们在命令行进入到我们要创建的目录，输入 scrapy startproject banciyuan 创建scrapy项目创建的项目结构如下二：为了方便使用pycharm执行scrapy项目，新建main.pyfrom scrapy import cmdlinecmdline.execute("scrapy crawl banciyuan".split())再edit configuration然后进行如下设
复制链接

扫一扫