pyspider 的测试和使用(Windows) 参考简书Py_Explorer用户和博客SiHann两位写的

1安装

pip install pyspider

2安装PhantomJS  链接http://phantomjs.org/download.html

 

下载好解压,将其放在bin目录下(我的是在D:\python\Library\bin)

3可能会遇见错误1

å¨è¿éæå¥å¾çæè¿°

python3.7不兼容pyspider问题(出现占用关键字的问题)

Python 3.5中引入了async和await,它们在Python 3.7中成为关键字。
所以需要替换一下关键字。
分别在run.py、tornado_fetcher.py、webui>app.py,ctrl+f查找async替换掉就可以了。

2错误2

 

这是我遇到的,然后网上居然没有特别明显的解决,费劲千辛万苦才查到,这是WsgiDAV发布了版本 pre-release 3.x导致的,所以只要把版本降下来就好了。
将wsgidav替换为2.4.1
•# python -m pip install wsgidav==2.4.1

3错误3

ssl599错误

解决方法
在on_start()加validate_cert=False

def on_start(self):
   self.crawl('https://www.lagou.com/jobs/list_python%E7%88%AC%E8%99%AB?labelWords=&fromSearch=true&suginput=', callback=self.index_page, validate_cert=Flase)

4错误4

TypeError: initialize() got an unexpected keyword argument ‘io_loop

 

原因:python环境中,默认tornado版本是最新的5.0,在4.0之后就废弃了io_loop参数。

解决方法:

1、pip uninstall tornado

2、pip install tornado==4.1

最后运行不报错的话就成功了

然后可以测试一下,可以参考https://www.jianshu.com/p/ce9d26d32bcfhttps://blog.csdn.net/SiHann/article/details/88239892这两篇,我就是参考的,最后测试可行,想试一下的也可以试试

 

但是平心而论,不建议使用pyspider,会占用浏览器,还有一些其他弊端就不再一一细说,还是使用scapy框架的好,做一下简单不需要日常维护的小型项目还是可以的,反正本人不会常使用的 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值