1.通过 id 定位元素
from selenium import webdriver
#创建WebDriver对象,指明使用Firefox浏览器驱动
wd = webdriver.Firefox(r ‘Firefox驱动的位置’)
#调用 WebDriver 对象的get方法 可以让浏览器打开指定网址
wd.get(‘https://www.baidu.com’)
#根据id选择元素,返回的就是该元素对应的WebElement对象
element = wd.find_element_by_id(‘kw’)
#通过该 WebElement对象,就可以对页面元素进行操作了
#输入字符串到这个 输入框里
element.send_keys(‘白月黑羽’)
#点击百度一下
wd.find_element_by_id(‘su’).click()
2.通过 class_name定位元素
from selenium import webdriver
#创建WebDriver对象,指明使用Firefox浏览器驱动
wd = webdriver.Firefox(r ‘Firefox驱动的位置’)
#调用 WebDriver 对象的get方法 可以让浏览器打开指定网址
wd.get(‘http://cdn1.python3.vip/files/selenium/sample1.html’)
#根据class name 选择元素,返回的是 一个列表
#里面都是class 属性值为 animal的元素对应的 WebElement对象
elements = wd.find_elements_by_class_name(‘animal’)
#取出列表中的每个 WebElement对象,打印出其text属性的值
#text属性就是该 WebElement对象对应的元素在网页中的文本内容
for element in elements:
print(element.text)
运行结果
3.通过 tag_name定位元素
from selenium import webdriver
wd = webdriver.Firefox(r ‘Firefox驱动的位置’)
wd.get(‘http://cdn1.python3.vip/files/selenium/sample1.html’)
#根据tag name 选择元素,返回的是 一个列表
#里面都是 tag 名为 div 的元素对应的 WebElement对象
elements = wd.find_elements_by_tag_name(‘div’)
#取出列表中的每个 WebElement对象,打印出其text属性的值
#text属性就是该 WebElement对象对应的元素在网页中的文本内容
for element in elements:
print(element.text)
运行结果
4.通过WebElement对象选择元素
不仅 WebDriver对象有 选择元素 的方法, WebElement对象 也有选择元素的方法。
WebElement对象 也可以调用 find_elements_by_xxx, find_element_by_xxx 之类的方法
WebDriver 对象 选择元素的范围是 整个 web页面, 而
WebElement 对象 选择元素的范围是 该元素的内部。
from selenium import webdriver
#创建WebDriver对象,指明使用Firefox浏览器驱动
wd = webdriver.Firefox()
#调用 WebDriver 对象的get方法 可以让浏览器打开指定网址
wd.get(‘http://cdn1.python3.vip/files/selenium/sample1.html’)
element = wd.find_element_by_id(‘container’)
#限制 选择元素的范围是 id 为 container 元素的内部。
spans = element.find_elements_by_tag_name(‘span’)
for span in spans:
print(span.text)
运行结果
5.find_element 和 find_elements 的区别
使用 find_elements 选择的是符合条件的 所有 元素, 如果没有符合条件的元素, 返回空列表
使用 find_element 选择的是符合条件的 第一个 元素, 如果没有符合条件的元素, 抛出 NoSuchElementException 异常
(1)使用 find_elements 选择的是符合条件的 所有 元素
(2)使用 find_elements 选择元素, 如果没有符合条件的元素, 返回空列表
(3)使用 find_element 选择的是符合条件的 第一个 元素
(4)使用 find_element 选择元素, 如果没有符合条件的元素, 如果没有符合条件的元素, 抛出 NoSuchElementException 异常
6.设置等待时间
(1)设置隐私等待(建议当创建浏览器驱动时就把隐私等待时间设置好)
from selenium import webdriver
wd = webdriver.Firefox()
#设置隐私等待时间,当元素没有找到的时候,并不立即返回找不到元素的错误。而是周期性(每隔半秒钟)重新寻找该元素,直到该元素找到;
#或者超出指定最大等待时长,这时才 抛出异常(如果是 find_elements 之类的方法, 则是返回空列表)。
wd.implicitly_wait(10)
wd.get(‘https://www.baidu.com’)
element = wd.find_element_by_id(‘kw’)
element.send_keys(‘白月黑羽\n’)
element = wd.find_element_by_id(‘1’)
#打印出 第一个搜索结果的文本字符串
print (element.text)
(2)使用sleep方法
from selenium import webdriver
wd = webdriver.Firefox()
wd.get(‘https://www.baidu.com’)
element = wd.find_element_by_id(‘kw’)
element.send_keys(‘白月黑羽\n’)
#等待 2 秒
from time import sleep
sleep(2)
#2秒 过后,再去搜索
element = wd.find_element_by_id(‘1’)
#打印出 第一个搜索结果的文本字符串
print (element.text)