主要方法是:
def param_main(self, response):
all_item_css = response.css("div.item")
# 各种操作...
yield scrapy.Request(response.url, callback=self.param_main, dont_filter=True, meta={})
想要循环抓取同一URL,必须在yield scrapy.Request
中,同时满足以下两点:
callback
指向自己(类似于递归)dont_filter=True
这时这个url才能是自己的url