环境安装(windows): (1)pip install wheel (2)下载twisted (3)安装twisted pip install Twisted- pip install pywin32 pip install scrapy
测试:创建一个工程:
scrapy startprojiect xxPro
在spiders子目录中创建一个爬虫文件
scrapy genspider spiderName www.xxx.com
执行工程:
scrapy crawl spiderName
打开setting.py文件,将“ROBOTSTXT_OBEY = True ” 中True修改为False
再次执行工程
scrapy crawl first --nolog # (--nolog 不显示日志)
在setting.py中设置日志输出信息,可以只输出错误日志信息