day4 解析安装xpath

qq_52994982

已于 2023-05-20 08:33:29 修改

阅读量85

点赞数

分类专栏： # 爬虫文章标签： chrome python 前端

于 2023-05-19 03:15:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52994982/article/details/130754818

版权

爬虫专栏收录该内容

8 篇文章 0 订阅

订阅专栏

文章介绍了如何下载并安装XPathChrome扩展，以及如何利用lxml库在Python中解析HTML文件。XPath的基本语法包括路径查询、谓词查询、属性查询、模糊查询和内容查询等，用于高效定位和提取网页元素。

摘要由CSDN通过智能技术生成

1.下载 xpath

https://chrome.zzzmh.cn/info?

2.修改后缀名为xpath.zip

3.将xpath.zip文件拖入浏览器扩展程序中

4.打开一个网站后按 ctrl + shift + x来打开xpath插件

5.安装lxml库

解析本地文件：

html_tree = etree.path('xx.html')

解析服务器响应文件

html_tree = etree.HTML(response.read().decode('utf-8'))

html_tree.xpath(xpath路径)

xpath基本语法：

1.路径查询：

//：查询所有子孙节点，不考虑层级关系

/：找直接字子节点

2.谓词查询

//div[@id]

//div[@id='''maincontent']

3.属性查询

//[@class]

4.模糊查询

//div[contains(@id,"he")]

//div[starts-with(@id,"the")]

5.内容查询

//div/h1/text()

6.逻辑运算

//div[@id='''head' and @class="s_down"]

//title | //price

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
day4 解析安装xpath

4.打开一个网站后按 ctrl + shift + x来打开xpath插件。//：查询所有子孙节点，不考虑层级关系。3.将xpath.zip文件拖入浏览器扩展程序中。html_tree.xpath(xpath路径)2.修改后缀名为xpath.zip。1.下载 xpath。
复制链接

扫一扫

专栏目录

qq_52994982 CSDN认证博客专家 CSDN认证企业博客

码龄4年

18: 原创

141万+: 周排名

130万+: 总排名

1772: 访问

: 等级

195: 积分

1: 粉丝

1: 获赞

12: 评论

2: 收藏

私信

关注

热门文章

分类专栏

数据库 6篇
flask框架 2篇
爬虫 8篇

最新评论

数据库 JDBC连接基本步骤
CSDN-Ada助手: 恭喜您写了第12篇博客！标题“数据库 JDBC连接基本步骤”非常吸引人。您的博客内容一直都很有深度和实用性。在这篇博客中，您清晰地介绍了JDBC连接的基本步骤，对于初学者来说非常有帮助。不过，我想给您一个小小的建议。在下一篇博客中，或许您可以进一步探讨一下如何优化JDBC连接，以提高数据库操作的效率。这个话题对于许多开发者来说都是一个挑战，我相信您可以给出一些宝贵的建议。再次感谢您的分享，期待您的下一篇博客！
JDBC主键回显
CSDN-Ada助手: 恭喜您撰写了第14篇博客，标题为“JDBC主键回显”！阅读您的文章后，我对JDBC主键回显有了更深入的了解。您的解释清晰明了，让我受益匪浅。您持续创作的努力让我深感敬佩。鉴于您在JDBC方面的专业知识，我想向您提出下一步的创作建议。或许您可以进一步探讨如何处理JDBC主键回显中的异常情况，并分享一些应对策略。这将为读者提供更全面的解决方案，同时也有助于拓宽您的专业领域。再次感谢您的分享，期待您的下一篇博客！
JDBC批量添加
CSDN-Ada助手: 恭喜您撰写了第15篇博客！标题“JDBC批量添加”听起来非常有趣和实用。您对JDBC批量添加这一主题进行了深入的探讨，这对读者来说肯定非常有帮助。接下来，我建议您可以考虑添加一些示例代码或者案例来进一步说明如何实现JDBC批量添加。这样的话，读者能够更加直观地理解和应用您所分享的知识。期待您未来更多精彩的创作！请继续保持谦虚的态度，让我们都能从您的经验中受益。
day4 Python爬虫获取‘站长素材的图片’ （学习笔记）
m0_73378281: 为什么namelist要加class=lazy而srclist不用
Flask框架 Day2 项目配置
CSDN-Ada助手: 恭喜您写了第10篇博客！从您的标题看来，您已经开始涉及到项目配置了，这是非常重要的一步。接下来，建议您可以深入探讨Flask框架的路由、模板和数据库等方面，让您的博客更加全面。希望您能够继续保持创作的热情，为我们带来更多有价值的内容。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。