Python 基础 之 lxml 下载、xpath使用规则的详细说明、综合使用
推荐xpath 学习网站:https://www.w3school.com.cn/xpath/xpath_functions.asp
目录
Python 基础 之 lxml 下载、xpath使用规则的详细说明、综合使用
3、XPath 轴(通过XPath获取祖先节点,属性值,兄弟节点等等,这就是XPath的节点轴。轴可定义相对于当前节点的节点集。)
1、lxml 补全功能:把上端HTML中的节点没有闭合,我们可以使用lxml中的etree模块进行补全
4、如果我们不要获取所有节点而是指定获取某个名称的节点,只需要将*改为指定节点名称即可。如获取所有的li节点
5、获取子节点:根据Xpath的常用规则我们可以使用/或//获取子孙节点或子节点,现在我要获取li节点下的a节点
6、获取文本信息:使用text()方法获取节点中的文本。现在获取所有a标签的文本信息
7、获取属性信息:可以通过@匹配指定的属性。我们通过class属性找最后一个li节点
8、获取父节点:可以通过..获取当前节点的父节点。现在我要获取第二个a节点的父节点下的class属性
9、contains()函数:contains()匹配一个属性值中包含的字符串,匹配获取
10、多属性匹配:很多情况下无法仅仅根据一个属性值就获取到目标节点,往往要根据多个属性来获取目标节点
一、简单介绍
Python是一种跨平台的计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,