1、/选取直接子节点
2、//选取子孙节点
3、.选取当前节点
4、..选取当前节点的父节点
5、@选取属性 @href
6、text()方法节点中的文字
7、匹配属性[@属性名=“属性值”] 例如:[@href="link1.html"] 获取属性和匹配属性是有区别的。一定要加以区分。
8、单属性对多个值的要用到contains()函数 例如:[contains(@class,"li")]
9、多属性限定时,要用and连接 例如html.xpath('//li[contains(@class,"li") and @name="item"]/a/text()
10、匹配到多个节点,只想要其中某个节点时,可以利用方括号中传入索引号获取特定次序的节点。
如:html.xpath('//li[i]/a/text()')
html.xpath('//li[last()]/a/text()')
html.xpath('//li[position()<3]/a/text()')
11.节点轴 获取属性 attribute::*
获取子元素:child::*
获取兄弟元素: sibling::*
获取子孙节点:descendant::*
获取祖先节点:ancestor::*