XPath匹配含有指定文本的标签---contains的用法

最新推荐文章于 2025-04-02 19:54:31 发布

peiwang245

最新推荐文章于 2025-04-02 19:54:31 发布

阅读量5.5k

点赞数

分类专栏：爬虫

原文链接：https://www.cnblogs.com/liangmingshen/p/11567780.html

版权

爬虫专栏收录该内容

27 篇文章

订阅专栏

1、标签中只包含文字

<div>
  <ul id="side-menu">
    <li class="active">
      <a href="#">
      卷期号：
      </a>
    </li>
  </ul>
</div>

取包含 '卷期号' 三个字的节点 //ul[@id='side-menu']/li/a[contains(text(),"卷期号")]

取其内容 //ul[@id='side-menu']/li/a[contains(text(), '卷期号')]/text()

运行结果：

2、文字没有被一个明确的标签包裹

<div>
  <ul id="side-menu">
    <li class="active">
      <a href="#">
        <i>DOI</i>
        卷期号：
        <span>xxxx</span>
      </a>
    </li>
  </ul>
</div>

再用上边的xpath表达式就到不到了, 不过可以借助string()，将a标签里边的东西全部转换成字符串, 再用contains判断：//ul[@id='side-menu']/li/a[contains(string(), '卷期号')]/text()

运行结果：

3、

link = response.css(u'div[data-ajax="true"] a:contains("下页")::attr(href)').extract_first() # css选择器

运行结果

/Zbgg/Index/4028?type=sgzb

参考：

https://www.cnblogs.com/liangmingshen/p/11567780.html

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

peiwang245

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

XPath 文本内容的模糊匹配：灵活筛选和定位元素的高级技巧

小蓝枣的博客

07-13

1579

XPath 是一种强大的查询语言，用于在 XML 和 HTML 文档中定位和提取元素。文本内容的模糊匹配是 XPath 的一项高级技巧，它允许我们使用通配符、正则表达式和特定函数来实现模糊匹配的筛选和定位。本篇博客将深入探讨 XPath 文本内容的模糊匹配技巧，通过详细的解释和实例演示，展示它在元素筛选和定位方面的优势和灵活性。

XPath 文本内容定位

小蓝枣的博客

07-13

1607

XPath 是一种强大的查询语言，用于在 XML 和 HTML 文档中定位和提取元素。文本内容定位是 XPath 的一项重要技巧，它允许我们根据元素的文本内容来准确筛选和定位目标元素。本篇博客将深入探讨 XPath 文本内容定位的方法和技巧，通过详细的解释和实例演示，展示它在元素筛选和定位方面的优势和灵活性。

参与评论您还未登录，请先登录后发表或查看评论

一个标签中有多行（多个）文本的情况如何使用xpath根据包含指定文本内容定位到元素

xing_gy的博客

04-25

533

一个标签中有多行（多个）文本的情况如何使用xpath根据包含指定文本内容定位到元素

xpath定位中starts-with、contains和text()的用法

最新发布

m0_73978383的博客

04-02

1452

XPath（XML Path Language）即 XML 路径语言，是一种用于在 XML 和 HTML 文档中查找信息的语言。它基于 XML 文档的树状结构，提供了在数据结构树中找寻节点的能力。通过 XPath，你可以使用路径表达式来定位和选择文档中的节点或节点集，这些节点可以是元素、属性、文本、命名空间、处理指令、注释以及文档（根）节点等。比如，在一个图书管理系统的 XML 文档中，你可以利用 XPath 快速定位到所有价格高于 50 元的图书节点，获取它们的书名、作者等信息。

XPath匹配含有指定文本的标签

开心就好的专栏

09-18

2万+

xpath匹配含有指定文本的标签对于一般的情况, 就是标签中只包含文字, 这种的比较规范, 如: &amp;lt;div&amp;gt; &amp;lt;ul id=&quot;side-menu&quot;&amp;gt; &amp;lt;li class=&quot;active&quot;&amp;gt; &

xpath定位中详解id 、starts-with、contains、text()和last() 的用法

weixin_34313182的博客

03-19

2439

xpath定位中详解id 、starts-with、contains、text()和last() 的用法原文地址https://www.cnblogs.com/unknows/p/7684331.html 1、XPATH使用方法使用XPATH有如下几种方法定位元素（相比CSS选择器，方法稍微多一点）： a、通过绝对路径定位元素（不推荐！） WebElement ele = driver.f...

XPath-Helper

04-09

XPath（XML Path Language）是一种在XML文档中查找信息的语言，它允许我们选取XML节点，如元素、属性、文本等。XPath-Helper是一款针对XPath查询的高效工具，特别为谷歌浏览器设计，极大地简化了网页元素的选择和...

Java+Selenium框架：定位页面元素方法之Xpath-高级定位

我先测了

04-02

5629

在自动化测试领域，Selenium是一个功能强大的工具，它支持多种语言，包括Java。XPath（XML Path Language）是一种在XML文档中查找信息的语言，它同样适用于HTML页面的元素定位。XPath定位方式在Selenium中非常受欢迎，因为它提供了非常灵活和强大的定位能力。

webdriver.find_element()方法使用xpath匹配部分文本并忽视大小写的案例

10-27

如果想要忽略大小写使用XPath来匹配部分文本，你需要在XPath表达式中使用`normalize-space()`函数，并结合`starts-with()`或`contains()`来忽略大小写。下面是一个例子： ```python from selenium.webdriver import...

使用 xpath 定位包含指定文本内容的标签

HeatDeath的博客

05-16

4万+

browser.find_element_by_xpath('//button/span[contains(text(), "指定文本内容")]').click()指定文本内容可以是匹配全部文本也可是匹配部分文本

python xpath 包含指定文字的对象

weixin_29207533的博客

08-29

208

我整理的一些关于【path】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/xltfov使用 Python 和 XPath 查找包含指定文字的对象在进行网页数据抓取时，XPath 是一种非常强大的工具。XPath（XML Path Language）允许用户通过路径表达式在...

python xpath匹配text()中含指定内容的方法

热爱编程并专注于Python

12-22

7196

python xpath匹配text()中含指定内容的方法 xpath方法：contains() 方法名及参数作用 contains() 包含匹配/模糊匹配 <td>创建人:</td> <td class="td_left">刘某人</td> <td>创建机构:</td> <td class="td_left">某某机构</td> # 定位td标签内

CSS复合样式用selenium定位xpath写法（用contain text()方法）

猎摘互联网软件测试业界技术文章专用博客

06-09

5102

XPath里面有一个函数叫text()，这个东西是专门用来打印出HTML文档标签里中间夹杂着的文字，这个表达式//*[contains(text(），'后台审核')] ，意思就是说，查找整个HTML文档里，从根节点开始数，不管什么标签，只要中间有“后台审核”四个字，就给我定位到。 XPath里面有一个函数叫text()，这个东西是专门用来打印出HT

xpath 匹配带单引号、双引号的文本(字符串)

weixin_41934979的博客

08-11

653

SyntaxError: Failed to execute 'evaluate' on 'Document'

Xpath 匹配节点的内容为空（inner text 为空）

farawayplace613的专栏

02-17

1万+

需求是从以下写出能从下面的xml中取出Title内容（inner text）为空的节点的XPath： Asp.net 22.5 Abraham 22.5 Abraham 容易写出错误的xPath有: //Book[Title[text()='']] /

使用xpath获取标签下所有文本值（包括子标签的值）

qq_30653631的博客

02-07

1万+

最近在使用xpath提取信息时，由于所提取页面的数据标签比较凌乱，我只想要获取页面所显示的文本信息，因此通过查询相关资料，总结出如下方法： 1.获取文本值及所有html标签 html_content3 = requests.get(details_url).text html = etree.HTML(html_content3) # content=html.xpath('//...