selenium的一些要注意的地方

本文记录了使用selenium爬取北邮人论坛时遇到的问题及解决方案,包括'geckodriver'路径问题、TimeoutException错误以及解决办法。还提到了模拟键盘操作和PhantomJS的使用,并给出了python+scrapy+selenium结合爬虫的实践示例。
摘要由CSDN通过智能技术生成

今天在尝试了一下如何爬取北邮人论坛,最后使用selenium来实现了。

下面记录一下使用selenium要注意的地方。


  • python selenium模块使用出错,错误代码为:Message: ‘geckodriver’ executable needs to be in PATH.
ubuntu16.04环境下 解决方法:
下载 geckodriverckod   
地址: mozilla/geckodriver
解压后将geckodriverckod 存放至 /usr/local/bin/ 路径下即可
sudo mv ~/Downloads/geckodriver /usr/local/bin/

#具体答案可以查看下面的链接

链接:https://www.zhihu.com/question/49568096/answer/131093426


  • 出现错误:selenium.common.exceptions.TimeoutException: Message: Screenshot: available via screen

driver = webdriver.PhantomJS(service_args=[‘–ignore-ssl-errors=true‘, ‘–ssl-protocol=

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值