上一篇学习了Scrapy爬虫框架需要的库及其安装,在需要的库都准备好了之后,就可以进入Scrapy的项目创建了。
1、首先我们需要创建项目:
依次输入:cmd(打开命令行)>>>D:>>>D:\python相关\pycharm\untitled\scrapy>>>scrapy startproject xiaozhu
当然大家也可以选择其他盘创建项目,我这里选择的是D盘。另外注意,scrapy文件夹需提前存在。
然后我们就能看到我们在pycharm创建的项目和其他自带的文件了,最后我们在spiders文件夹下新建xiaozhuspider.py文件,用于爬虫代码的编写。
按照上面的步骤操作后,得到以下的结构
2、Scrapy文件介绍
对于上面的结构,主要解释的包括以下内容:
items.py
pipelines.py
settings.py
xiaozhuspider.py
综上所述,scrapy就像是填空题,把相对应的文件代码补全就能实现爬虫,但是呢,要填好填空题或者怎么去填,之后再学习并记录啦,初步实验了一下很不习惯,但确实很强大,如果对于大规模的爬虫,或者要重复进行的爬虫,应该会大大提高效率。