1、在scrapy的pipeline中,获取settings参数,可使用如下方式:
def open_spider(self, spider):
settings = spider.settings
web_dir_dict = settings.get('WEB_DIR_DICT', {})
也可以采用如下方式:
from scrapy.utils.project import get_project_settings
###中间代码略
def open_spider(self, spider):
settings = get_project_settings()
web_dir_dict = settings.get('WEB_DIR_DICT', {})
2、如果settings中的参数是小写的,比如上面代码中的WEB_DIR_DICT如果写成web_dir_dict,则会获取不到。
在Scrapy的pipeline中,可以通过`spider.settings`或者`get_project_settings()`来获取settings参数。例如,获取名为`WEB_DIR_DICT`的参数,需要注意参数名必须保持全大写,否则将无法正确获取。此细节对于正确配置和使用Scrapy爬虫至关重要。
3万+

被折叠的 条评论
为什么被折叠?



