XPATH常用知识点整理

xpath相关符号以及意义介绍

11701876-9c0e7f53dfec1452.png
屏幕快照 2019-05-02 上午11.38.57.png

XPATH选择器

nodeName 选取此节点的所有节点
/ 从根节点选取
// 从匹配选择的当前节点选择文档中的节点,不考虑它们的位置
. 选择当前节点
.. 选取当前节点的父节点
@ 选取属性

  • 匹配任何元素节点
    @* 匹配任何属性节点
    Node() 匹配任何类型的节点

CSS选择器

“*” 选取所有节点
“#container” #表示取id 取id为container的节点
“.container ” . 表示取类class 取class为container的节点
.class .color 选择class=”color”的所有元素
id #info 选择id=”info”的所有元素
element p 选择所有的p元素
element,element div,p 选择所有div元素和所有p元素
element element div p 选择div标签内部的所有p元素
[attribute] [target] 选择带有targe属性的所有元素
[arrtibute=value] [target=_blank] 选择target=”_blank”的所有元素

一些用法

li a 中间空格 表示取 li 下的所有 a 元素
ul+p 选取ul后面的第一个p元素
div#cntainer>ul 表示 选取id为container的div 的第一个ul子元素
ul~p 选取与ul相邻的所有p元素
a[title] 选取所有有title属性的a元素
a[href="https://www.abc.com"] 选取所有属性为https://www.abc.com的a的元素
a[href*="jobble"] 选取所有href 属性包含jobble的a 元素
a[href^="https"] 选取所有以https开头的a元素
a[href$=".jpg"] 选取所有以.jpg结尾的a元素
input[type=radio]:checked 选取选中的radio元素
div:not(#container) 选取所有id 非 container 的 div属性
li:nth-child(2) 选取第3个li元素
对于scrapy.selector.unified.SelectorList对象,getall()==extract(),get()==extract_first()
对于scrapy.selector.unified.Selector对象,getall()==extract(),get()!=extract_first()

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值