爬虫-使用xpath拿36KR的数据-xpath的学习与演练

目标网站

首页_36氪
https://36kr.com/

界面展示

在这里插入图片描述

练习

取title标签,用到/符号

/符号,从根节开始选取

在这里插入图片描述

在这里插入图片描述

// 从当前节点往下找,可以跳着找

在这里插入图片描述

… 返回上一级标签

拿属性 @ 拿link里面的herf

@ 取标签的属性

在这里插入图片描述

拿文本 text()

拿所有a标签里包裹的文本内容

<a> xxyy </a>

取xxyy

在这里插入图片描述

拿所有a标签的链接地址

在这里插入图片描述

拿所有a标签下的所有样式

在这里插入图片描述

寻找标签,对属性有要求

需求

找样式为

home-flow-article-description ellipsis-2

div

取里面的内容

标签[@属性=‘值’]

在这里插入图片描述

获取 查找下一页的 链接地址

1,拿到更多资讯的标签

2,从标签 中取href的值

//a[@class='kr-home-flow-see-more']/@href

在这里插入图片描述

xpath的使用-通过xpath_helper进行的演练 - pyhui的python全栈技术博客 - CSDN博客
https://blog.csdn.net/ifubing/article/details/102501730

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

鲸鱼编程pyhui

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值