python中scrapy库应用实例
首先,你已经安装好了pycharm
第一步,安装库,我们要知道pycharm有非常好用的库的安装,我们点击file—>settings----->进入这个界面
点击加号进入下一个界面,输入scrapy,点击install package按钮,进入安装,安装巨慢,稍等他一下。
安装完成。
第二步:在pycharm界面中打开 View --> Tool Windows --> Terminal(这个意思是终端就相当于一个cmd的窗口,只不过在pycharm中)我们可以先查看一下有没有成功安装,在里面输入scrapy,成功的就长这样,不成功看看是不是字母写错了
第三步:
cd 到指定的目录下,你自己决定,然后输入
scrapy startproject +文件名称
例如:
scrapy startproject ITcast
然后你的项目就华丽丽的好了
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200602115739225.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQyODUzNzA3,size_16,color_FFFFFF,t_70
说明:
文件说明:
scrapy.cfg 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中)
items.py 设置数据存储模板,用于结构化数据,如:Django的Model
pipelines.py 数据处理行为,如:一般结构化的数据持久化
settings.py 配置文件,如:递归的层数、并发数,延迟下载等
spiders 爬虫目录,如:创建文件,编写爬虫规则
注意:一般创建爬虫文件时,以网站域名命名