以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:
-
选择元素:
-
选择所有p元素: //p
-
选择根元素: /
-
-
属性匹配:
-
选择class属性为"example"的div元素: //div[@class='example']
-
-
文本内容提取:
-
提取所有a元素的文本内容: //a/text()
-
提取第一个p元素的文本内容: //p[1]/text()
-
-
使用逻辑运算符:
-
选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
-
-
使用位置谓词:
-
选择前三个li元素: //li[position() <= 3]
-
选择最后一个p元素: //p[last()]
-
-
使用通配符:
-
选择所有元素: //*
-
选择div元素下的任意子元素: //div/*
-
-
使用轴:
-
选择div元素的所有祖先元素: //div/ancestor::*
-
选择span元素之后的所有兄弟元素: //span/following-sibling::*
-
以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。
本文由 mdnice 多平台发布