【爬虫——00005】选择器

在这里插入图片描述

构造一个用于选择标题标记内文本的xpath

在这里插入图片描述

要实际提取文本数据,必须调用选择器 .get() 或 .getall() 方法

.get() 
.getall() 

返回单个结果;如果有多个匹配项,则返回第一个匹配项的内容

在这里插入图片描述

返回包含所有结果的列表

在这里插入图片描述
问题部分
在这里插入图片描述

答案部分

在这里插入图片描述

返回 None 如果未找到元素,并且如何返回默认值代替None

在这里插入图片描述

xpath返回属性值的方法,也可以用于css选择器

.attrib
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述在这里插入图片描述

css选择器扩展

在这里插入图片描述

选择文本节点

请使用 ::text

选择属性值

::attr(name)

选择 元素 子代的子文本节点 <title> 元素

在这里插入图片描述

选择当前选择器上下文的所有子代文本节点

*::text

在这里插入图片描述

如果你总是想要一个字符串

default=''

在这里插入图片描述

选择 href 后代链接的属性值

a::attr(href)

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值