1、selenium定位方法
1)单元素定位。selenium提供了8中定位方式
- id
- name
- class name
- tag name
- link text -- 完全匹配链接文字
- partial link text -- 模糊匹配链接文字
- xpath
- css selector
这8中定位方式在python selenium中所对应的方法为:
- find_element_by_id()
- find_element_by_name()
- find_element_by_class_name()
- find_element_by_tag_name()
- find_element_by_link_text()
- find_element_by_partial_link_text()
- find_element_by_xpath()
- find_element_by_css_selector()
2)WebDriver还提供了8种用于定位一组元素的方法
- find_elements_by_id()
- find_elements_by_name()
- find_elements_by_class_name()
- find_elements_by_tag_name()
- find_elements_by_link_text()
- find_elements_by_partial_link_text()
- find_elements_by_xpath()
- find_elements_by_css_selector()
- 定位一组元素的方法与定位单个元素的方法类似,唯一的区别是在单词element后面多了一个s表示复数。
3)定位frame/iframe表单中的元素
- 在Web应用中经常会遇到frame/iframe表单嵌套页面的应用,WebDriver只能在一个页面上对元素识别与定位,对于frame/iframe表单内嵌页面上的元素无法直接定位。
- 这时就需要通过switch_to.frame()方法将当前定位的主体切换为frame/iframe表单的内嵌页面中。
126邮箱登陆的页面大概是这个样子:
<html>
<body>
...
<iframe id="x-URS-iframe" ...>
<html>
<body>
...
<input name="email" >
2、定位方法的用法
1)单个元素定位
假设有这样一个页面,我们的目的是要定位input标签的输入框。
<html>
<head>
<body link="#0000cc">
<a id="result_logo" href="/" onmousedown="return c({'fm':'tab','tab':'logo'})">
<form id="form" class="fm" name="f" action="/s">
<span class="soutu-btn"></span>
<input id="kw" class="s_ipt" name="wd" value="" maxlength="255" autocomplete="off">
</form>
<a class="mnav" href="http://news.baidu.com" name="tj_trnews">新闻</a>
<a class="mnav" href="http://www.hao123.com" name="tj_trhao123">hao123</a>
</body>
</head>
</html>
初始化操作:
from selenium import webdriver
dw = webdriver.Chrome()
- 通过id定位
dw.find_element_by_id("kw")
- 通过name定位
dw.find_element_by_name("dw")
- 通过class name定位
dw.find_element_by_class_id("kw")
- 通过tag name定位
dw.find_element_by_tag_name("input")
-
通过xpath定位
dw.find_element_by_xpath("//*[@id='kw']")
dw.find_element_by_xpath("//*[@name='wd']")
dw.find_element_by_xpath("//input[@class='s_ipt']")
dw.find_element_by_xpath("/html/body/form/span/input")
dw.find_element_by_xpath("//span[@class='soutu-btn']/input")
dw.find_element_by_xpath("//form[@id='form']/span/input")
dw.find_element_by_xpath("//input[@id='kw' and @name='wd']")
- 通过css定位
dw.find_element_by_css_selector("#kw")
dw.find_element_by_css_selector("[name=kw]")
dw.find_element_by_css_selector(".s_ipt")
dw.find_element_by_css_selector("html > body > span > input")
dw.find_element_by_css_selector("span.south-btn > input#kw")
dw.find_element_by_css_selector("form#form > span > input")
- 通过link test定位文本链接
dw.find_element_by_link_text("新闻")
dw.find_element_by_link_text("hao123")
- 通过partial link定位文本链接
dw.find_element_by_partial_link_text("新")
dw.find_element_by_partial_link_text("hao")
dw.find_element_by_partial_link_text("123")
2)定位一组元素
# 定位一组元素
texts = driver.find_elements_by_tag_name('a')
# 循环遍历出每一条搜索结果的wenben
for t in texts:
print(t.text)
3、demo
1)简书首页的查询
from selenium import webdriver
import time
wd = webdriver.Chrome()
wd.get("https://www.jianshu.com/") # 打开简书
wd.find_element_by_class_name("search-input").send_keys("selenium") # 定位输入框并输入关键字
wd.find_element_by_class_name("search-btn").click() #点击搜索
time.sleep(3) #等待3秒
wd.quit() #关闭浏览器
2)126邮箱登陆
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get("http://www.126.com")
driver.switch_to.frame(0)
time.sleep(5)
driver.find_element_by_name("email").clear()
driver.find_element_by_name("email").send_keys("username")
driver.find_element_by_name("password").clear()
driver.find_element_by_name("password").send_keys("password")
driver.find_element_by_id("dologin").click()
driver.switch_to.default_content()
time.sleep(5)
driver.quit()