scrapy Xpath表达式

最新推荐文章于 2020-10-14 19:18:57 发布

「已注销」

最新推荐文章于 2020-10-14 19:18:57 发布

阅读量150

点赞数 1

分类专栏： web server

本文链接：https://blog.csdn.net/qq_40435621/article/details/89180691

版权

66 篇文章 0 订阅

订阅专栏

在XPath中，有七种类型的节点：元素、属性、文本、命名空间、处理指令、注释以及文档（根）节点。

父：每个元素及属性都有一个父。
子：元素节点可有零个、一个或多个子。
同胞：拥有相同的父的节点。
先辈：某个节点的父、父的父、等
后代：某个节点的子、子的子、等

XPath使用路径表达式来选取xml文档中的节点或者节点集。
选取节点表达式：

表达式	描述
nodename	选取此节点的所有子节点
/	从根节点上选取
//	从匹配选择的当前节点选择文档中的节点，而不考虑他们的位置
.	选取当前节点
…	选取当前节点的父节点
@	选取属性

谓语是用来查找某个特定的节点或者包含某个指定的值的节点。
谓语被包含在方括号中。

路径表达式	结果
/bookstore/book[1]	选取属于 bookstore 子元素的第一个 book 元素。
/bookstore/book[last()]	选取属于 bookstore 子元素的最后一个 book 元素。
/bookstore/book[last()-1]	选取属于 bookstore 子元素的倒数第二个 book 元素。
/bookstore/book[position()< 3]	选取最前面的两个属于 bookstore 元素的子元素的 book 元素。
//title[@lang]	选取所有拥有名为 lang 的属性的 title 元素。
//title[@lang=‘eng’] 选取所有 title 元素，	且这些元素拥有值为 eng 的 lang 属性。
/bookstore/book[price>35.00]	选取 bookstore 元素的所有 book 元素，且其中的 price 元素的值须大于 35.00。
/bookstore/book[price>35.00]/title	选取 bookstore 元素中的 book 元素的所有 title 元素，且其中的 price 元素的值须大于 35.00。

实例：

通过在路径表达式中使用“|”运算符，您可以选取若干个路径。

我感觉这个没有上面的方便，就暂时不介绍了以后用到了再来梳理一遍

运算符	描述	实例	返回值
+	加法	6 + 4	10
-	减法	6 - 4	2
*	乘法	6 * 4	24
div	除法	8 div 4	2
=	等于	price=9.80	如果 price 是 9.80，则返回 true。如果 price 是 9.90，则返回 false。
!=	不等于	price!=9.80	如果 price 是 9.90，则返回 true。如果 price 是 9.80，则返回 false。
<	小于	price<9.80	如果 price 是 9.00，则返回 true。如果 price 是 9.90，则返回 false。
<=	小于或等于	price<=9.80	如果 price 是 9.00，则返回 true。如果 price 是 9.90，则返回 false。
>	大于	price>9.80	如果 price 是 9.90，则返回 true。如果 price 是 9.80，则返回 false。
>=	大于或等于	price>=9.80	如果 price 是 9.90，则返回 true。如果 price 是 9.70，则返回 false。
or	或	price=9.80 or price=9.70	如果 price 是 9.80，则返回 true。如果 price 是 9.50，则返回 false。
and	与	price>9.00 and price<9.90	如果 price 是 9.80，则返回 true。如果 price 是 8.50，则返回 false。
mod	计算除法的余数	5 mod 2	1

关注

专栏目录