Xpath使用路径表达式来选取XML文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似
表达式 | 描述 |
---|---|
nodename | 选取此节点的所有子节点,类似css中的标签选择器 |
/ | 从根节点选取,也就是当前节点的最顶层(默认情况下当前节点是html最顶层,若从某元素开始,当前节点为此元素) |
// | 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置 |
. | 选取当前节点 |
. . | 选取当前节点的父节点 |
@ | 选取属性 |
注意:当你使用父元素find_element_by_xpath这种方式定位的时候,元素定位表达式必须以点开头,如
ele = driver.find_elements_by_xpath("//div[@id=‘category-block’]//ol/li")
b = ele.find_elements_by_xpath(".//li[@class=‘subcate-item’")
如果不用点,会从整个文档开始找,即使你前面使用了父元素也没有效果,xpath就是这样实现的
缺点:
xpath这种定位放式,webdriver会将整个页面的所有元素进行扫描以定位我们所需要的元素,这是个非常费时的操作,如果脚本中大量使用xpath做元素定位的话,脚本的执行速度可能会稍慢