数据解析-xpath

最新推荐文章于 2024-09-26 11:55:47 发布

努力减肥的钱学生

最新推荐文章于 2024-09-26 11:55:47 发布

阅读量357

点赞数 5

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39504722/article/details/135156164

版权

XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素，并且 XQuery 和 XPointer 都构建于 XPath 表达之上.

节点的关系

父（Parent）
子（Children）
同胞（Sibling）
先辈（Ancestor）
后代（Descendant）

谓语

谓语被嵌在方括号内，用来查找某个特定的节点或包含某个制定的值的节点

选择XML文件中节点：

element（元素节点）
attribute（属性节点）
text() （文本节点）
concat(元素节点,元素节点)
comment （注释节点）
root （根节点）

XPath工具

浏览器-元素-Ctrl+F
浏览器-控制台-$x(表达式)
Xpath helper (安装包需要科学上网)

安装

python若使用需要安装lxml模块

pip install lxml

Xpath实战-纵横网

from fake_useragent import UserAgent
import requests
from lxml import etree
from time import sleep


for i in range(1,6):
 
  print(f'========正在获取第{i}页数据=======')
  url = f'http://www.zongheng.com/rank/details.html?rt=1&d=1&p={i}'
  headers = {'User-Agent':UserAgent().chrome}
  resp = requests.get(url,headers =headers)


  # 构造etree对象
  e = etree.HTML(resp.text)


  names = e.xpath('//div[@class="rank_d_b_name"]/@title')
  for name in names:
    print(name)
  sleep(1)

努力减肥的钱学生

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

努力减肥的钱学生

博客等级

码龄7年

23
原创

265
点赞

271
收藏

184
粉丝

关注

私信

热门文章

最新评论

python之数组，链表，栈，队列
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
爬虫实战-猫眼电影爬虫
CSDN-Ada助手: 恭喜你写了这么精彩的一篇博客，猫眼电影爬虫实战的内容非常实用，对于想学习爬虫的人来说肯定会有很大帮助。希望你能继续坚持创作，分享更多有价值的内容。下一步，或许可以考虑分享一些爬虫在其他领域的应用实例，或者是一些爬虫技术的深入讨论，这样可以让读者有更多的学习收获。加油！
爬虫提高效率-进程，进程池，线程，协程
CSDN-Ada助手: 恭喜您写了第20篇博客，标题看起来非常有深度！提到了爬虫效率的提高，内容一定非常有价值。不过对于我来说，进程、进程池、线程、协程还是比较复杂的概念，希望您在下一篇博客中能够给出更多实际案例或者操作技巧，让我们这些初学者也能够更好地理解和应用。期待您的下一篇作品！
爬虫（6）-json和jsonpath
CSDN-Ada助手: 恭喜作者发布了第18篇博客，“爬虫（6）-json和jsonpath”，看来您对爬虫知识的探索不断深入，真是令人钦佩。不过接下来，我建议您可以尝试结合实际案例，分享一些在使用json和jsonpath时遇到的问题及解决方法，这样可以让读者更好地理解和应用这些知识。期待您的下一篇作品！
爬虫（4）
CSDN-Ada助手: 恭喜你写了第14篇博客！能够坚持不懈地创作实在是令人钦佩。希望你可以继续分享关于爬虫的知识，或许可以考虑写一些实例分析，或者深入探讨爬虫在特定领域的应用。当然，这只是一个建议，期待你在创作上的更多精彩表现！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。