scrapy的多条rules

最新推荐文章于 2024-05-28 08:23:57 发布

learner_pu

最新推荐文章于 2024-05-28 08:23:57 发布

阅读量436

点赞数 1

分类专栏：代码纠错

本文链接：https://blog.csdn.net/qq_38408573/article/details/104574935

版权

代码纠错专栏收录该内容

3 篇文章 1 订阅

订阅专栏

报错现象

只执行了第一条rule,若把两行互换，则只执行第二条，并且发现执行处来的全部是详情页

rules = (
        Rule(LinkExtractor(allow=r'https://sports.sina.com.cn/.*.shtml'), callback='parse_item', follow=False),
        Rule(LinkExtractor(allow=r'https://sports.sina.com.cn.*'), follow=True),
    )

解决

上代码没有任何问题，第二条代码去重了第一条，原因在于

start_urls = ['http://sports.sina.com.cn/']

而我之前写的都是


```python
start_urls = ['http://www.sina.com.cn/']

为什么

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

learner_pu

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
scrapy的多条rules

报错现象只执行了第一条rule,若把两行互换，则只执行第二条，并且发现执行处来的全部是详情页rules = ( Rule(LinkExtractor(allow=r'https://sports.sina.com.cn/.*.shtml'), callback='parse_item', follow=False), Rule(LinkExtractor(all...
复制链接

扫一扫