1准备 :redis数据库,Python的scrapy-redis包,[mysql数据库]redis安装目录下redis.windows.conf 配置文件修改bind 0.0.0.0[或局域网内,外网的IP地址]
protected-mode no
2配置scrapy settings文件设置设置
SCHEDULER = "scrapy_redis.scheduler.Scheduler"
DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter"
ITEM_PIPELINES = {
'scrapy_redis.pipelines.RedisPipeline': 300,
# '其他'
}
REDIS_HOST = '192.168.216.94'
REDIS_PORT = 6379
[如果需要密码则REDIS_PASSWORD=""]
3修改Spider 文件:
spider 文件里导入from scrapy_redis.spiders import RedisSpider,并且让爬虫类继承RedisSpider
取消start_urls,并在spider文件中设置redis_key ='你的redis的表名'