数据解析-xpath

最新推荐文章于 2023-09-21 16:36:56 发布

花林呀

最新推荐文章于 2023-09-21 16:36:56 发布

阅读量270

点赞数

分类专栏： xpath 爬虫文章标签： html 前端爬虫大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_63936579/article/details/125930964

版权

爬虫同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

优点：最常用且最便捷高效的一种解析方式，通用性强

原理：

-1.实例化一个etree的对象，且需要将被解析的页面源码数据加载到该对象中

-2.调用etree对象中的xpath方法结合着xpath表达式实现标签定位与内容捕获

环境：pip install lxml

实例化：from lxml import etree

-1.本地加载：etree.parse(filepath)

-2.网页加载：etree.HTML('page_text')

-3.xpath（’xpath表达式‘）重点

xpath表达式：

1./：表示从根节点开始定位，表示一个层级

2.//：表示多个层级，也可以表示从任意位置开始定位

3.属性定位：tag[@属性名=”属性值“]

eg：//div[@class="song"]

4.索引定位：tag[@属性名=”属性值“]/标签[索引] 注意索引是从一开始的

5.取文本：

/text():直系文本

//text():非直系，即所有文本

6.取属性：

/@属性名 eg：/@src

案例：爬取图片（无关键字）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据解析-xpath

本文介绍了最常用且最便捷高效的一种解析方式，通用性强
复制链接

扫一扫

专栏目录

花林呀 CSDN认证博客专家 CSDN认证企业博客

码龄3年

8: 原创

73万+: 周排名

11万+: 总排名

3115: 访问

: 等级

100: 积分

8: 粉丝

7: 获赞

5: 评论

15: 收藏

私信

关注

热门文章

分类专栏

教程
仿射加密 1篇
ai 1篇
yolo 1篇
xpath 1篇
爬虫 4篇
bs4 1篇

最新评论

mmsegmentaion训练自己的voc数据集，以autodl为平台
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
mmsegmentaion训练自己的voc数据集，以autodl为平台
玩具澳大利亚牧羊犬: 博主好强，通俗易懂！！！
信息安全仿射加密破解
CSDN-Ada助手: 恭喜您写了第7篇博客！标题“信息安全仿射加密破解”非常吸引人。您对这个领域的深入研究令人佩服。在这篇博客中，您讲解了仿射加密的破解方法，这确实是一个非常有趣且复杂的主题。我很喜欢您对加密算法的解析和应用案例的分享。在下一步的创作中，我希望您能够进一步探索不同类型的加密算法，并与我们分享它们的优缺点以及实际应用中的挑战。此外，如果您能够提供一些实用的加密保护措施或解决方案，将会更加引人入胜。再次恭喜您的持续创作，期待您未来更多精彩的博客！
目标检测用yolo格式数据集还是voc
CSDN-Ada助手: 非常感谢您对目标检测进行深入探讨的热情！对于使用yolo格式数据集还是voc，不同的人有不同的看法和经验。作为CSDN博客小助手，我们鼓励您写一篇较为详细的比较研究，并结合实际场景和应用需求选择更适合的数据集。此外，我们建议您可以进一步探讨目标检测中的实际应用场景和技术挑战，为读者提供更加有价值的技术博文主题建议。期待您的精彩分享！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
网络爬虫-http与https协议
Xd聊架构: 不错，值得推荐学习

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。