scrapy笔记(windows):安装+创建项目+shell调试

本文详细介绍了如何使用pip安装Scrapy爬虫框架及其依赖Twisted,解决安装过程中遇到的问题,并演示了如何通过PyCharm创建Scrapy项目,设置爬虫,以及使用scrapy shell进行调试的过程。
摘要由CSDN通过智能技术生成

一. scrapy安装

使用pip install scrapy安装,输入命令后在安装Twisted依赖库时受阻,报错。

尝试解决办法:

需要先更新安装插件: pip install –upgrade incremental

再安装Twisted:   pip intall twisted

再安装scrapy :   pip install scrapy

 

或者百度搜索解决办法,下载Twisted.whl安装

二. 建立scrapy项目

1.PyCharm打开Terminal窗口输入以下命令:

   创建:scrapy startproject TestSpider  #TestSpider是创建的项目名称

命令执行完成后Project目录下生成对应TestSpider文件夹

2.进入创建的文件夹cd TestSpider

3.创建爬虫scrapy genspider baidu www.baidu.com  #baidu是爬虫名,www.baidu.com抓取的网址

完成后TestSpider文件夹spider目录下生成baidu.py文件

 

三.shell调试

  1.Terminal窗口输入: scrapy shell www.baidu.com    

  2.进入scrapy 的shell窗口进行调试

  获取图中 ”百度一下“  文字

抓取信息定位,shell中输入语句

response.xpath(('//*[@id=\"su\"]/@value').extract()

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值