绝对路径: /
elements = driver.find_elements_by_xpath("/html/body/div")
css表达式 html>body>div
相对路径: //
elements = driver.find_elements_by_xpath("//div//p")
如果使用CSS选择器,则为 div p
通配符: /
如果要选择所有div节点的所有直接子节点,可以使用表达式 //div/*
*
是一个通配符,对应任意节点名的元素,等价于CSS选择器 div > *
elements = driver.find_elements_by_xpath("//div/*")
for element in elements:
print(element.get_attribute('outerHTML'))
根据属性选择: [@属性名='属性值']
//*[@id='west']
根据class属性选择,要写完整后面的关键词
//p[@class="capital huge-city"]
根据其他属性
//*[@multiple] #具有multiple属性的所有页面元素
属性值包含字符串
//*[contains(@style,'color')] #
要选择 style属性值 包含 color 字符串的 页面元素 ,
//*[starts-with(@style,'color')] #
要选择 style属性值 以 color 字符串 开头
的 页面元素 ,可以这样
按照次序选择
//div/p[2]
父元素为div 中的 p类型 第2个 子元素
//div/*[2]
选择父元素为div的第2个子元素,不管是什么类型
//p[last()]
选取p类型倒数第1个子元素
//p[last()-1]
选取p类型倒数第2个子元素
//div/p[last()-2]
父元素为div中p类型倒数第3个子元素
范围选择
- 选取option类型第1到2个子元素
//option[position()<=2]
或者
//option[position()<3]
- 选择class属性为multi_choice的前3个子元素
//*[@class='multi_choice']/*[position()<=3]
- 选择class属性为multi_choice的后3个子元素
//*[@class='multi_choice']/*[position()>=last()-2]
组选择、父节点、兄弟节点
//option | //h4
选所有的option元素 和所有的 h4 元素
option , h4 (等同于 css )
//*[@class='single_choice'] | //*[@class='multi_choice']
css: .single_choice , .multi_choice
某个元素的父节点用 /..
表示
//*[@id='china']/..
//*[@id='china']/../../..
后续 兄弟节点,用这样的语法 following-sibling::
要选择 class 为 single_choice 的元素的所有后续兄弟节点
//*[@class='single_choice']/following-sibling::*
等同于css: .single_choice ~ *
要选择后续节点中的div节点
//*[@class='single_choice']/following-sibling::div
选择 前面的
兄弟节点,用这样的语法 preceding-sibling::
要选择 class 为 single_choice 的元素的所有前面的兄弟节点
//*[@class='single_choice']/preceding-sibling::*
ps:
某个元素内部使用xpath选择元素, 需要 在xpath表达式最前面加个点
# 先寻找id是china的元素
china = wd.find_element_by_id('china')
# 再选择该元素内部的p元素
elements = china.find_elements_by_xpath('.//p')
# 打印结果
for element in elements:
print('----------------')
print(element.get_attribute('outerHTML'))