定位策略
建议使用的语法如下:
- find_element(By.ID,“kw”) find_element(By.NAME,“wd”)
- find_element(By.CLASS_NAME,“s_ipt”) find_element(By.TAG_NAME,“input”)
- find_element(By.LINK_TEXT,u" 新闻 ")
- find_element(By.PARTIAL_LINK_TEXT,u" 新 ")
- find_element(By.XPATH,“//*[@class=‘bg s_btn’]”)
- find_element(By.CSS_SELECTOR,“span.bg s_btn_wr>input#su”)
使用如下语法方便封装和拓展,工作中也发现使用语法(如 driver.find_element_by_id)有在不同环境运行不通的情况。
其中元素定位的策略为:
- 优先级最高:ID
- 优先级其次:name
- 优先级再次:CSS selector
- 优先级再次:Xpath
ID定位优先级第一,因为ID是唯一的,所以定位速度较快以及稳定。在主流浏览器css相对于xpath运行较快,但是css语法不持续模糊匹配,轴定位等,所以优先选择css,复杂的定位选择xpath
等待策略
选用隐士等待与显示等待相结合的方式
隐式等待:使用隐式等待,在一个脚本中定位每个元素的时候都会自动调用隐
式等待,当调用的元素加载出来以后,隐式等待就不会在等待了,超过设置的等待时间,就会报错。
显示等待:元素加载出来后,不一定是能够被点击的,有可能需要其他元素渲染出来,显示等待可以为等待设置条件,如可以被点击等,设置隐士等待后,显示等待相对隐士等待的时间较长
driver = webdriver.Chrome()
driver.implicitly_wait(10) # 隐性等待和显性等待可以同时用,但要注意:等待的最长时间取两者之中的大者
driver.get('https://www.baidu.com')
locator = (By.LINK_TEXT, '新闻')
try:
wait = WebDriverWait(driver, 20, 0.5)
# 判断元素是否在DOM页面结构中
wait.until(EC.presence_of_element_located(locator))
# 判断是否可见
wait.until(EC.visibility_of_element_located(locator))
# 判断是否可点击
wait.until(EC.element_to_be_clickable(locator))
print(driver.find_element(By.PARTIAL_LINK_TEXT, u"新").get_attribute('href'))
finally:
driver.close()