目标网站
首页_36氪
https://36kr.com/
界面展示
练习
取title标签,用到/符号
/符号,从根节开始选取
// 从当前节点往下找,可以跳着找
… 返回上一级标签
拿属性 @ 拿link里面的herf
@ 取标签的属性
拿文本 text()
拿所有a标签里包裹的文本内容
<a> xxyy </a>
取xxyy
拿所有a标签的链接地址
拿所有a标签下的所有样式
寻找标签,对属性有要求
需求
找样式为
home-flow-article-description ellipsis-2
div
取里面的内容
标签[@属性=‘值’]
获取 查找下一页的 链接地址
1,拿到更多资讯的标签
2,从标签 中取href的值
//a[@class='kr-home-flow-see-more']/@href
xpath的使用-通过xpath_helper进行的演练 - pyhui的python全栈技术博客 - CSDN博客
https://blog.csdn.net/ifubing/article/details/102501730