Lxml解析模块

最新推荐文章于 2024-08-29 14:47:26 发布

景康达

最新推荐文章于 2024-08-29 14:47:26 发布

阅读量135

点赞数

文章标签： python html xpath

本文链接：https://blog.csdn.net/qq_51744139/article/details/120583387

版权

本文介绍了Python的Lxml库在解析HTML时如何利用XPath进行操作，详细讲解了XPath的常用规则，并提供了具体的代码示例，展示了如何查找特定节点和筛选包含指定值的元素。

摘要由CSDN通过智能技术生成

Lxml解析模块

Xpath常用规则

表达式	含义
nodename	选取此节点的所有子节点
/	从根节点选取
.	选取当前节点
@	选取属性
*	选取所有元素节点与元素名
@*	选取属性
[@attrib]	选取具有给定属性的所有元素
[@attrib=‘value’]	选取给定属性具有给定值的所有元素
[tag]	选取所有指定元素的直接子节点
tag=‘text’	选取所有具有指定元素并且文本内容是text的节点

用法示例

from lxml import etree
text='''
<div>
    <u1>
        <li class="item-1"><a href="link1.html">第一个</a></li>
        <li class="item-2><a href="link2.html">second.item</a></li>
        li class=

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

景康达

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Lxml解析模块

Lxml解析模块Xpath常用规则表达式含义nodename选取此节点的所有子节点/从根节点选取.选取当前节点@选取属性*选取所有元素节点与元素名@*选取属性[@attrib]选取具有给定属性的所有元素[@attrib=‘value’]选取给定属性具有给定值的所有元素[tag]选取所有指定元素的直接子节点tag=‘text’选取所有具有指定元素并且文本内容是text的节点用法示例from lxml im
复制链接

扫一扫