scrapy 下爬取不同的网站，使用同一个settings时，设置自己的settings各个参数

最新推荐文章于 2024-08-05 20:06:05 发布

西门大盗

最新推荐文章于 2024-08-05 20:06:05 发布

阅读量1.6k

点赞数

分类专栏： scrapy 文章标签： scrapy settings 自定义参数

本文链接：https://blog.csdn.net/xiongzaiabc/article/details/83931482

版权

scrapy 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

比如有project1，和project2两个网站要爬取，第一个网站已经使用了settings中的配置，那么project2的配置需要在project2.py中自定义，如下，放到custom_settings 这个字典里：

 custom_settings = {
    'ITEM_PIPELINES':{'quotetutorial.pipelines.MongoPipeline': 400,},
        'DEFAULT_REQUEST_HEADERS':{
            'User-Agent': 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)',
            'Accept-Encoding': 'gzip,deflate',
            'Accept-Language': 'zh-cn,zh,en'
        }

    }

注意：在这里的custom_settings 中有设置的参数，才会生效，如果没有设置，就默认采用settings中设置的；

如果settings和这里的custom_settings 同时对一个参数进行设置，那么project2运行时，只会默认custom_settings中设置的参数。