报错现象
只执行了第一条rule,若把两行互换,则只执行第二条,并且发现执行处来的全部是详情页
rules = (
Rule(LinkExtractor(allow=r'https://sports.sina.com.cn/.*.shtml'), callback='parse_item', follow=False),
Rule(LinkExtractor(allow=r'https://sports.sina.com.cn.*'), follow=True),
)
解决
上代码没有任何问题,第二条代码去重了第一条,原因在于
start_urls = ['http://sports.sina.com.cn/']
而我之前写的都是
```python
start_urls = ['http://www.sina.com.cn/']
为什么