网页解析只xpath

安装

pip install lxml

pycharm中运用
导入 from lxml import etree

创建一个soup对象 xpath_obj = etree.HTML(所需解析的内容)
==对象为字符串类型 ==

用法 xpath_obj.xpath(‘xpath表达式’)
XPath 使用路径表达式在 XML/HTML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。

下面列出了最有用的路径表达式:
在这里插入图片描述
谓语
谓语用来查找某个或某些特定的节点或者包含某个指定值的节点
谓语被嵌在方括号中。实例:
在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果。
在这里插入图片描述
选取未知节点
XPath通配符可用来选取未知节点
在这里插入图片描述
选取多个路径
通过在路径表达式中使用"|"运算符,您可以选取若干个路径。
在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值