linux - selenuim&PhantomJS

简单的说,就是下载解压后,放到/usr/bin,然后加上执行权限,命令如下:
$ unzip chromedriver_linux64.zip
$ sudo mv chromedriver /usr/bin/
$ cd /usr/bin/
$ sudo chmod +x chromedriver
安装geckodriver步骤和上面的一样
  • 三种等待方式详解

  • 强制等待
    第一种也是最简单粗暴的一种办法就是强制等待time.sleep(xx),强制让闪电侠等xx时间,不管凹凸曼能不能跟上速度,还是已经提前到了,都必须等xx时间。

from selenium import webdriver
from time
driver = webdriver.Firefox()
driver.get('https://huilansame.github.io')
time.sleep(3) # 强制等待3秒再执行下一步
print driver.current_url
driver.quit()

这种叫强制等待,不管你浏览器是否加载完了,程序都得等待3秒,3秒一到,继续执行下面的代码,作为调试很有用,有时候也可以在代码里这样等待,不过不建议总用这种等待方式,太死板,严重影响程序执行速度。

  • 隐性等待
    隐形等待是设置了一个最长等待时间,如果在规定时间内网页加载完成,则执行下一步,否则一直等到时间截止,然后执行下一步。注意这里有一个弊端,那就是程序会一直等待整个页面加载完成,也就是一般情况下你看到浏览器标签栏那个小圈不再转,才会执行下一步,但有时候页面想要的元素早就在加载完成了,但是因为个别js之类的东西特别慢,我仍得等到页面全部完成才能执行下一步,我想等我要的元素出来之后就下一步怎么办?有办法,这就要看selenium提供的另一种等待方式——显性等待wait了。
    需要特别说明的是:隐性等待对整个driver的周期都起作用,所以只要设置一次即可,我曾看到有人把隐性等待当成了sleep在用,走哪儿都来一下…
from selenium import webdriver
driver = webdriver.Firefox()
driver.implicitly_wait(30) # 隐性等待,最长等30秒
driver.get('https://huilansame.github.io')
print driver.current_url
driver.quit()
  • 显性等待
    第三种办法就是显性等待,WebDriverWait,配合该类的until()和until_not()方法,就能够根据判断条件而进行灵活地等待了。它主要的意思就是:程序每隔xx秒看一眼,如果条件成立了,则执行下一步,否则继续等待,直到超过设置的最长时间,然后抛出TimeoutException。
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
driver = webdriver.Firefox()
driver.implicitly_wait(10) # 隐性等待和显性等待可以同时用,但要注意:等待的最长时间取两者之中的大者
driver.get('https://thecodehot.com')
locator = (By.LINK_TEXT, 'CSDN')
try:
	WebDriverWait(driver, 20, 0.5).until(EC.presence_of_element_located(locator))
	print(driver.find_element_by_link_text('CSDN').get_attribute('href'))
finally:
	driver.close()

上例中,我们设置了隐性等待和显性等待,在其他操作中,隐性等待起决定性作用,在WebDriverWait…中显性等待起主要作用,但要注意的是:最长的等待时间取决于两者之间的大者,此例中为20,如果隐性等待时间 > 显性等待时间,则该句代码的最长等待时间等于隐性等待时间。
http://www.jb51.net/article/92672.htm


  • 安装PhantomJS
    使用sudo apt-get install phantomjs安装后,运行代码会有如下错误:
 WebDriverException: Message: Error - Unable to load Atom 'find_element' from file ':/ghostdriver/./third_party/webdriver-atoms/find_element.js'

The reason is that I used apt-get install Phantomjs to install it, but it seems that it is not full-function Phantomjs installed by apt-get. So please wget or download manually from Phantomjs website and move it to into PATH.

  • 正确的安装方法是:
  • Purge old phantomjs
    apt purge phantomjs
  • Wget the latest phantomjs (as per http://phantomjs.org/download.html)
    wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-2.1.1-linux-x86_64.tar.bz2
  • Untar it
    tar xvjf phantomjs-2.1.1-linux-x86_64.tar.bz2
  • Moved the phantomjs executable to /usr/bin/ (may need sudo)
    cp /phantomjs-2.1.1-linux-x86_64/bin/phantomjs /usr/bin/
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值