关于Scrapy: 如何分别从Spider、Middleware、Pipeline获取settings.py里的参数

本文介绍了在Scrapy项目中,如何在Spider、Middleware和Pipeline中分别获取settings.py的参数。详细讲解了settings的优先级,包括命令行选项、项目设定、命令默认设定和全局默认设定。并通过实例展示了在Spider的parse函数、Middleware和Pipeline中获取settings的方式。同时提到了get_project_setting()方法的优缺点,虽然简单但无法识别命令行传入的高优先级参数。
摘要由CSDN通过智能技术生成

运行环境

PyCharm 2018.1
Scrapy 1.5.1
Python 3.5.4
Windows 10


settings的优先级

官方文档中scrapy中settings参数有四个级别:

  1. 命令行选项(Command line Options)(最高优先级)
  2. 项目设定模块(Project settings module)
  3. 命令默认设定模块(Default settings per-command)
  4. 全局默认设定(Default global settings) (最低优先级)


Spider

  1. 在parse()函数中获取settings
def parse(self, response):
	print(self.settings.get('CONFIG_KEY'))
  1. 在实例化spider时获取settings:
class MySpider(scrapy.Spider):
	
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值