Xpath安装见:https://www.jianshu.com/p/d4262c8d8af8
Xpath使用:
xpath是一种小型的查询语言,不仅支持HTML的查找,也能够在XML文档中查找信息,还可通过元素和属性进行导航。
在python中使用xpath要依赖lxml库,安装方式参见:
用xpath选取节点:
nodename:选取此节点的所有子节点
/:从根节点选择
//:从匹配选择的当前节点选择文档中的节点,不考虑位置
.:选取当前节点
..:选取当前节点的父节点
/text():获取当前路径下的文本内容
/@xxx:提取当前路径下标签的属性值
丨可选符:可选取若干个路径,在当前路径下选取所有符合条件的p标签和div标签
xpth('/body/div[1]'):选取body下的第一个div节点
xpath('/body/div[last()]'):选取body下最后一个div节点
xpath('/body/div[last()-1]'):选取body下倒数第二个div节点
xpath('/body/div[position()<3]'):选取body下前两个div节点
xpath('/body/div[@class]'):选取body下带有class属性的div节点
xpath('/body/div[@class="main"]'):选取body下class属性为main的div节点
xpath('/body/div[price>35.00]'):选取body下price元素大于35的div节点
参考资料: