上一篇scrapy爬虫起步(1)–第一个爬虫程序介绍了利用scrapy进行数据抓取的一个简单例子,需要从命令行运行。有些时候我们需要的是直接从代码中调用,Scrapy提供了相应的接口,具体见这儿在脚本中运行Scrapy
实践过程中发现版本不一样程序差距蛮大,我现在使用的版本是:Scrapy 0.24.6
,因此参照的是0.24的文档,如果选择最新的文档在脚本中运行Scrapy会有问题,使用时需要注意一下。
贴下代码吧:
# coding=utf-8
__author__ = 'Jeffee Chen'
from ifeng.spiders.groupSpider import GroupSpider
from scrapy.crawler import Crawler