xpath获取标签的属性值_xpath系列第3篇---谓语

最新推荐文章于 2024-03-18 18:44:39 发布

weixin_39589644

最新推荐文章于 2024-03-18 18:44:39 发布

阅读量315

点赞数

文章标签： xpath获取标签的属性值

上一篇所讲解的选取节点的方法，在面对复杂的文档时，会显得力不从心，原因在于无法做到精确选取，本篇讲介绍xpath语法里的谓语，通过该语法，可以精确的定位自己想要的节点，本篇文章所使用的数据如下

html_data

1. 通过标签的属性选取节点

from

文档中的标签，必然大量的重复，我们可以通过是否具有某个属性进行过滤，如果还是不能精确定位，则可以通过属性值进行准确定位，div[@class='div1'] 明确表示寻找class的属性值为div1的div标签。

1.1 多个属性选取

如果想选取既有class属性，又有name属性的li节点，则可以使用and进行连接

from lxml import etree

tree = etree.HTML(html_data)
li_nodes = tree.xpath("//li[@class and @name]")
print(li_nodes)

同理，你可以使用or来连接属性，表示有其中一个即可被选中

1.2 不包含某个属性

想选取不包含某个属性的节点，可以使用not关键字

from lxml import etree

tree = etree.HTML(html_data)
li_nodes = tree.xpath("//li[not(@class)]")

print(li_nodes)

2. 通过顺序选取节点

from

3. 通过标签值选取

from

通过对a标签的值进行比较，可以更加准确的定位数据

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39589644

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

XPath 谓语的概念与作用

小蓝枣的博客

07-12

288

XPath 是一种强大的查询语言，用于在 XML 和 HTML 文档中定位和提取元素。 XPath 的谓语是一项关键特性，它允许我们在 XPath 表达式中添加条件，从而实现对元素的更精确的定位和筛选。本篇博客将深入探讨 XPath 谓语的概念和作用，通过详细的解释和实例演示来展示它在定位和筛选元素方面的优势和灵活性。

XPath 谓语的使用方法和语法

小蓝枣的博客

07-12

321

XPath 是一种强大的查询语言，用于在 XML 和 HTML 文档中定位和提取元素。 XPath 的谓语是一项关键特性，它允许我们在 XPath 表达式中添加条件，从而实现对元素的更精确的筛选和定位。本篇博客将深入探讨 XPath 谓语的使用方法和语法，通过详细的解释和实例演示来展示它在元素筛选和定位方面的优势和灵活性。

参与评论您还未登录，请先登录后发表或查看评论

xpath语法-谓语

weixin_30952103的博客

05-16

263

转载于:https://www.cnblogs.com/angdh/p/10878631.html

Xpath语法之谓语小记

caicaibird0531的博客

05-29

1023

谓语用来查找某个特定的节点或者包含某个指定的值的节点，被嵌在方括号中。路径表达式描述 /bookstore/book[1] 选取bookstore下的第一个book元素 /bookstore/book[last()] 选取bookstore下的倒数第二个book元素。 bookstore/book[position()<4] 选取bookstore下前面三个子元素...

XPath 语法规则

10-07

918

翻译：Linyupark / 2006-03-24XPath is a language for finding information in an XML document. XPath is used to navigate through elements and attributes in an XML document.Xpath是一种能够在XML文档中寻找信息的语言。它通过XML文

XPath语法以及谓语的结合使用

weixin_30920853的博客

02-24

286

/* XPath 术语节点（Node）在 XPath 中，有七种类型的节点：元素、属性、文本、命名空间、处理指令、注释以及文档（根）节点。XML 文档是被作为节点树来对待的。树的根被称为文档节点或者根节点。请看下面这个 XML 文档： <?xml version="1.0" encoding="ISO-8859-1"?> <bookstore> ...

xpath_helper-master.rar

04-30

2. **属性获取**：可以获取元素的属性值，如`//img/@src`选取所有`img`元素的`src`属性。 3. **文本内容提取**：`//p/text()`选取所有`p`元素的文本内容。 4. **过滤和条件判断**：利用XPath的谓语表达式可以进行更...

xpath-help-2.0.2

02-10

3. **谓语增强**：谓语（Predicate）在XPath 2.0中可以包含复杂的表达式，而不仅仅是简单的索引。这允许更精确地定位节点。 4. **顺序和排序**：XPath 2.0支持对节点集进行排序，甚至可以在选取节点时保持或改变...

XPath 谓语运算符：等于、不等于、包含等

小蓝枣的博客

07-12

652

XPath 是一种功能强大的查询语言，用于在 XML 和 HTML 文档中定位和提取元素。 XPath 的谓语运算符是谓语中的比较运算符，它们允许我们对元素的属性值或其他特征进行比较，从而实现更精确的筛选和定位。本篇博客将深入探讨 XPath 谓语运算符的使用方法和语法，通过详细的解释和实例演示来展示它们在元素筛选和定位方面的优势和灵活性。

xpath获取标签的属性值_爬虫学习之xpath

weixin_39646412的博客

11-20

1093

前面学习了使用requests获取页面源码，今天一起学习如何解析源码？xpath表达式：是最常用最便捷高效的一种解析方式且，通用性强。解析原理： 1、实例化一个etree对象，且需要将被解析的页面源码数据加载到该etree对象中。 2、调用etree对象中的xpath方法，结合xpath表达式实现标签定位和内容获取。环境安装： pip install lxml实例化etree对象： from lx...

xpath获取标签的属性值_解析库之Xpath，pyquery

weixin_39843431的博客

11-20

3109

Xpath#encoding='utf-8'#XPath,全称XML Path Language,即XML 路径语言，它是一门在XML 文档中查找信息的语言。#它最初是用来搜寻XML文档的，但是它同样适用于HTML文档的搜索。#XPath常用规则：nodename 选择此节点的所有子节点；/从当前节点选择直接子节点；//从当前节点选择子孙节点;#. 选取当前节点；.. 选取当前...

xpath获取标签的属性值_【S01E01】lxml.html、lxml.etree和Xpath

weixin_39851008的博客

11-20

2879

第一部分 lxml.html和XPath I. 解析HTML II. XPath语法第二部分 lxml.etree和XPath I. _Element对象和HtmlElement对象 II. Xpath语法 III. 查找节点（1）所有节点（2）子节点（3）父节点（4）属性匹配 IV. 获取信息（1）获取文本...

XPath 语法

国丰帮您解决各种网络问题-做网络我们是认真的！！！

05-08

241

目录XPath 语法选取节点谓语（Predicates）选取未知节点选取若干路径 XPath 语法 XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。选取节点 XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。下面列出了最有用的路径表达式：表达式描述 nodename 选取此节点的所有子节点。 / 从根节点选取。 // 从匹配选择的当前节点

爬虫必备技能xpath的用法和实战

weixin_33923762的博客

03-10

325

环境配置 1.本文使用的python版本是python3 2.使用到的依赖包如下： requestsscrapy 在安装 scrapy 之前需要先安装 Twisted(点击下载) 下载符合自己版本的 Twisted，然后将其放入 python 安装目录中，先使用命令安装 pip install Twisted。安装完之后，scrapy 就很容易安装了，安装命令如下： pip install scr...

xpath获取标签的属性值_xpath定位及与css定位的区别

weixin_39613561的博客

11-19

1181

xpath定位参考：茉上花开：web自动化测试-如何定位百度输入框zhuanlan.zhihu.com首先普及一下绝对路径和相对路径：绝对路径：c盘从根节点开始到指定文件夹，叫绝对定位相对定位：同一目录下，我们只要输入想要的文件即可拓展知识：文件的绝对路径与相对路径 - 爱努力的小疯子 - 博客园www.cnblogs.com绝对定位以/单斜杠开头，从根节点，严格按照顺序和位置来表达，父/子...

XPath表达式（一）--------使用 lxml 中的 xpath 高效提取文本与标签属性值

lizz2276的博客

07-30

713

# 我们爬取网页的目的，无非是先定位到DOM树的节点，然后取其文本或属性值 myPage = '''<html> <title>TITLE</title> <body> <h1>我的博客</h1> <div>我的文章</div> <div id="photos"> <img src="pic1.j...

XPath语法、轴、运算符-满满干货拿走不谢