Scrapy CSS选择器

CSS基本选择

1.通用选择器

response.css("*").extract()

2. 类型选择

选择指定标签的内容

<input></input>
.css(“div”)或者 response.css(“input”)

3. 类Class选择器

选择指定类的内容

<div class = "pic"></div>

Response.css(".pic")

4.ID选择器

选择指定ID的内容

<div id="pic"></div>

Response.css("#pic")

5.属性选择Attr选择器

按照给定的属性,选择所有匹配的元素。
语法:[attr] [attr=value] [attr~=value] [attr|=value] [attr^=value] [attr$=value] [attr*=value]

6.分组选择器

使用逗号分隔不同标签, 可以同时匹配到二者任意元素
Reponse.css(“div, span”)

6.后代组合器

组合选择前一个元素的后代节点, 匹配所有位于任意<div>元素之内的<span>
Reponse.css(“div span”)

7.直接子代组合器

组合选择前一个元素的直接子代节点, 匹配直接嵌套在 <ul> 元素内的所有 <li> 元素。
Response.css(“ul > li”)

7.一般兄弟组合器

选择兄弟元素,也就是说,后一个节点在前一个节点后面的任意位置,并且共享同一个父节点。匹配同一父元素下,<p> 元素后的所有 <span> 元素。
Reponse.css(“p ~ span”)

7.紧邻兄弟组合器

选择相邻元素,即后一个元素紧跟在前一个之后,并且共享同一个父节点。会匹配所有紧邻在 <h2> 元素后的 <p> 元素。
Response.css(“h2 + p”)

7.列组合器

选择属于某个表格行的节点。 会匹配所有 <col> 作用域内的 <td> 元素。
Response.css(“co || td”)

7.伪选择器

:: 伪选择器用于表示无法用 HTML 语义表达的实体。匹配所有 <p> 元素的第一行。
Response.css(“p::first-line”)

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值