Python——Xpath的知识梳理

最新推荐文章于 2024-07-20 17:12:48 发布

夜·晚

最新推荐文章于 2024-07-20 17:12:48 发布

阅读量122

点赞数 1

文章标签： python 开发语言

本文链接：https://blog.csdn.net/2201_75965563/article/details/133491151

版权

一.Xpath的介绍

XPath，全称 XML Path Language，即 XML 路径语言，它是一门在 XML 文档中查找信息的语言。最初是用来搜寻 XML 文档的，但同样适用于 HTML 文档的搜索。所以在做爬虫时完全可以使用 XPath 做相应的信息抽取。XPath 的选择功能十分强大，它提供了非常简洁明了的路径选择表达式。另外，它还提供了超过 100 个内建函数，用于字符串、数值、时间的匹配以及节点、序列的处理等，几乎所有想要定位的节点都可以用 XPath 来选择。

二.Xpath的安装

通过在Python中输入指令：pip install lxml

三.Xpath的语法

表达式	描述
/	根节点选取或下级
//	任意节点，不考虑位置
*	匹配任何节点
.	当前节点
..	当前节点的父节点
@	选取属性
nodename	根据节点筛选
text（）	文本内容
contains（@属性，“包含的内容”）	模糊查询

路径表达式	结果
bookstore	选取bookstore元素的所有子节点
/bookstore	选取根元素bookstore
bookstore/book	选取属于bookstore的子元素的所有book元素
//book	选取所有book子元素，而不管它们在文档中的位置
bookstore//book	选择属于bookstore元素的后代的所有book元素，而不管它们位于bookstore之下的什么位置
//@lang	选取名为lang的所有属性

四.实战练习

1.导入

2.html文档

3.查找内容

4.全部的运行结果

夜·晚

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Python——Xpath的知识梳理

XPath，全称，即 XML 路径语言，它是一门在 XML 文档中查找信息的语言。最初是用来搜寻 XML 文档的，但同样适用于 HTML 文档的搜索。所以在做爬虫时完全可以使用 XPath 做相应的信息抽取。XPath 的选择功能十分强大，它提供了非常简洁明了的路径选择表达式。另外，它还提供了超过 100 个内建函数，用于字符串、数值、时间的匹配以及节点、序列的处理等，几乎所有想要定位的节点都可以用 XPath 来选择。
复制链接

扫一扫