如果已经安装好了Scrapy,就可以开始下面的教程了。如果没有,可以看我的博文《安装Scrapy》进行安装后,再回来看哦!
接下来,我们将爬取 quotes.toscrape.com中的名人名言,作为本教程的素材。
入门教程共下列五步:
- 创建一个新的Scrapy项目
- 写一个spider去爬取网页和提取数据
- 使用命令行输出爬取的数据
- 根据链接递归爬取(爬取每一个链接)
- 使用spider 参数
创建一个Scrapy项目
在开始使用Scrapy之前,需要建立一个新的Scrapy项目。进入一个目录,输入下面命令,新建一个Scrapy项目
scrapy startproject tutorial
会建立一个tutorial目录,包含以下内容:
tutorial/ scrapy.cfg # deploy configuration file tutorial/ # project's Python module, you'll import your code from here __init__.py items.py # project items definition file middlewares.py # project middlewares file pi