关于scrapy的一小部分(链接提取)
以下过程在命令行中进行(win+R,输入cmd)
1.进入装有scrapy的磁盘中
2.
scrapy shell 要爬取的网址
from scrapy.linkextractors import LinkExtractor
link = LinkExtractor(allow=r'/book/1222_\d+\.html')
link.extract_links(response)
3.
关于scrapy的一小部分(链接提取)
以下过程在命令行中进行(win+R,输入cmd)
1.进入装有scrapy的磁盘中
2.
scrapy shell 要爬取的网址
from scrapy.linkextractors import LinkExtractor
link = LinkExtractor(allow=r'/book/1222_\d+\.html')
link.extract_links(response)
3.