操作系统:Windows10
Python版本:python 3.6.4
Scrapy版本:Scrapy 1.5.1
简述
1、打开cmd
2、scrapy startproject +自定义文件名1
3、scrapy genspider +自定义文件名2 +目标爬虫网站
(文件名2不需要同文件名1一样)
详细
第1步:打开cmd控制台
刚打开cmd控制台,一般是进入下图红色框框的路径
可以自行选择路径,你将要创建的路径将保存在这个路径下,如下图我保存在E盘
cd.. # 表示返回上一层目录
E: # 只有返回到根目录(C:\),才能输入E:进入E盘
cd Python # 进入E盘下的Python文件夹(需要先创建Python文件夹)
第2步:创建项目,自定义命名
scrapy startproject 名字 # 名字自定义,下图创建的文件名字为FileName
第3步:根据提示(上图绿色框)设置爬虫网站
cd FileName # 表示进入刚刚创建好爬虫文件
scrapy genspider 自定义名字 目标爬虫网站 # 这里自定义名字为BaiDu,目标爬虫网站为百度官网
# 这一步会在FileName这个项目下的spiders文件下生成一个BaiDu.py文件,这个文件也是主要编写代码的文件
第4步:创建完成,查看成果
打开pycharm,进入第1步中设置的路径,打开文件