用xpath提取html节点,利用Xpath提取HTML节点

XPath是一种用于定位XML和HTML文档中节点的语言。它描述了节点间的关系,如父节点、子节点、同胞节点等。XPath路径表达式包括选取特定节点、属性和文本内容。例如,`/div/a[2]/img`选取div下的第二个a元素内的img节点,而`//div[contains(@class,"post")]`则选取含有'post'类的div元素。" 110147907,10327828,KVM环境下详尽图文教程:CentOS7.6 Boot分区安装,"['虚拟化技术', 'Linux操作系统', 'CentOS', '服务器安装']
摘要由CSDN通过智能技术生成

目录

什么是Xpath?

常见的Xpath中节点及节点间的关系

Xpath路径表达式(节选)

2018.3.28更新

补充说明了 /(根节点的作用)

说明了/与//的区别

什么是Xpath?

Xpath是XML-路径语言的简称。顾名思义,Xpath可以用于定位XML文本的节点,但实际上,Xpath也适用于定位HTML中的节点。

节点及节点间的关系

在HTML中,节点就是一个个HTML标签。分析节点间的关系也就是要清楚HTML文档中各标签间的关系。厘清这些关系对于书写Xpath路径表达式来说非常重要。

节点间的关系(下面通过一段HTML代码说明:)

文章

父节点(Parent)

元素div是元素a的父节点;第二个元素a也是元素img的父节点。

子节点(Children)

元素a是元素div的子节点;元素img是子节点。

兄弟/同胞节点(Sibling)

兄弟节点在HTML中的地位相等,它们有相同的父节点。如上面例子中,两个a元素互为兄弟节点。

先辈节点(Descendant)

对于img元素来说,它的父节点(第二个a元素),和它的父节点的父节点(元素div)统称为img的先辈节点。在一个HTML文件中࿰

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值