scrapy爬虫编写-常用xpath选择器和css选择器

本文详细介绍了Scrapy爬虫中常用的XPath和CSS选择器的使用方法,包括各种语法、选择器整理及实际应用案例,帮助开发者更有效地提取网页数据。
摘要由CSDN通过智能技术生成

编写scrapy爬虫,处理items相关元素数据,涉及到selector, 整理备查。

目录

一、常用xpath使用方法

二、css语法

三、xpath选择器整理

四、css选择器整理

 

一、常用xpath使用方法:


xpath常用语法

/:根节点

//xxx/zzz:路径

//div:去全局的子孙中找所有的div元素

.//表示去当前对象的子孙中找

/xxx//div:去儿子对象中找xxx节点下所有的div元素

*:匹配任意节点元素

/html/body/div[1]:选取body下的第一个div节点

//div[@class="xxx"]:选取class属性为xxx的div节点

//@attr:获取attr对应的值

常用函数

text():提取文本信息,//*[@class='xxx']/text()

position():选取第几个节点,//*[position()=1]

last():选取最后一个节点,//*[last()]

starts-with(@attr,substr):attr属性值开头substr的节点

contains(@attr,substr):attr属性值是否包含substr

运算符

|:计算两个节点集合,比如//div|//li

比较运算符=,!=,<=...,比如//price[text()>10]

算数运算符:+,-,*,div,比如//price[text()+1]

逻辑运算符:or,and,[@class='xxxx' or @class='yyyy']


xpath语法案例:以取a标签为案例,div、span等都相同

xpath('//a'):找到全局中所有的a标签</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值