XPATH常用知识点整理

最新推荐文章于 2024-03-18 18:44:39 发布

mmd_0912

最新推荐文章于 2024-03-18 18:44:39 发布

阅读量253

点赞数

本文链接：https://blog.csdn.net/m0_37975258/article/details/103032352

版权

xpath相关符号以及意义介绍

屏幕快照 2019-05-02 上午11.38.57.png

XPATH选择器

nodeName 选取此节点的所有节点
/ 从根节点选取
// 从匹配选择的当前节点选择文档中的节点，不考虑它们的位置
. 选择当前节点
.. 选取当前节点的父节点
@ 选取属性

匹配任何元素节点
@* 匹配任何属性节点
Node() 匹配任何类型的节点

CSS选择器

“*” 选取所有节点
“#container” #表示取id 取id为container的节点
“.container ” . 表示取类class 取class为container的节点
.class .color 选择class=”color”的所有元素
id #info 选择id=”info”的所有元素
element p 选择所有的p元素
element,element div,p 选择所有div元素和所有p元素
element element div p 选择div标签内部的所有p元素
[attribute] [target] 选择带有targe属性的所有元素
[arrtibute=value] [target=_blank] 选择target=”_blank”的所有元素

一些用法

li a 中间空格表示取 li 下的所有 a 元素
ul+p 选取ul后面的第一个p元素
div#cntainer>ul 表示选取id为container的div 的第一个ul子元素
ul~p 选取与ul相邻的所有p元素
a[title] 选取所有有title属性的a元素
a[href="https://www.abc.com"] 选取所有属性为https://www.abc.com的a的元素
a[href*="jobble"] 选取所有href 属性包含jobble的a 元素
a[href^="https"] 选取所有以https开头的a元素
a[href$=".jpg"] 选取所有以.jpg结尾的a元素
input[type=radio]:checked 选取选中的radio元素
div:not(#container) 选取所有id 非 container 的 div属性
li:nth-child(2) 选取第3个li元素
对于scrapy.selector.unified.SelectorList对象，getall()==extract(),get()==extract_first()
对于scrapy.selector.unified.Selector对象，getall()==extract(),get()!=extract_first()

mmd_0912

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
XPATH常用知识点整理

xpath相关符号以及意义介绍屏幕快照 2019-05-02 上午11.38.57.pngXPATH选择器nodeName 选取此节点的所有节点/ 从根节点选取// 从匹配选择的当前节点选择文档中的节点，不考虑它们的位置. 选择当前节点.. 选取当前节点的父节点@ 选取属性匹配任何元素节点@* 匹配任何属性节点Node() ...
复制链接

扫一扫