在 Scrapy 中, 可以在 Spider 类的方法 parse 中调用 response.follow 来跟进一个链接。如果链接无效, 则 response.follow 会返回 None。你可以这样判断:
def parse(self, response):
next_page = response.css('a.next::attr(href)').get()
if next_page is not None:
next_page = response.urljoin(next_page)
yield response.foll