python中用于处理xpath的层级结构以及常见的操作。
1.xpath节点类型
根据网页审查元素层级,可以很清楚看到层级关系,外部层级是内部层级的父亲,内部层级是外部层级的子节点,不同的子节点之间是兄弟关系siblings,
2.xpath查找操作
/bookstore/book[1] book子元素的第一个元素 /bookstore/book[last()] 最后一个元素 /bookstore/book[last() - 1] 倒数第二个元素
//title[@lang] name为lang的所有title元素
* 匹配任何元素节点 @* 匹配任何属性节点
3.操作方法
下面的例子选取 price 节点中的所有文本:
/bookstore/book/price/text()
GetElementById()
GetElementsByName()
findClass()