@业务场景
- 当爬虫的主要工作集中在对超链接的深度爬取而非首页时适用
- 当定义好子链接爬取规则时,框架会自动对子链接进行访问,并将不同样式的子链接页面结果交由不同回调函数处理
- 本例对《使用scrapy框架爬取股票数据》进行改写
@创建CrawlSpider
- scrapy genspider -t crawl stock stock.10jqka.com.cn
- 则框架会自动生成爬虫模板stock.py
- stock.10jqka.com.cn为要爬取的首页
import scrapy
from scrapy.linkextractors import LinkExtractor
from scrapy.spiders import CrawlSpider, Rule
class