Python操作lxml库(Xpath篇)

在这里插入图片描述​ 

活动地址:CSDN21天学习挑战赛

学习的最大理由是想摆脱平庸,早一天就多一份人生的精彩;迟一天就多一天平庸的困扰。

学习日记

目录

学习日记

一、Xpath概述

1、Xpath简介

2、 Xpath的安装

二、Xpath的常用规则

1、路径查找

2、节点查找

3、未知节点

4、获取节点中的文本

5、选取多个路径

Python操作lxml库文章集合


一、Xpath概述


1、Xpath简介

  Xpath(XML Path Language) 是一门在 XML 文档中查找信息的语言,可以用来在XML文档中对元素和属性进行遍历。XPath 用于在 XML 文档中通过元素和属性进行导航。其是一种路径语言(XML Path Language),用来确定XML文档中某部分的位置。

  XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointerXSL间的语法模型。但是XPath很快的被开发者采用来当作小型*查询语言被广泛使用。

2、 Xpath的安装

Xpath只是 lxml 库中的一个模块,想要使用 Xpath 那么就需要安装 lxml 库

pip install lxml

二、Xpath的常用规则

1、路径查找

Xpath 的主要语法

2、节点查找

查找节点的一些语法

3、未知节点

        当我们匹配时会出现路径不确定的情况,这个时候我们就要涉及到匹配未知节点。匹配未知节点也有对应的语法。

4、获取节点中的文本

        通过 属性方法可以获取属性内的内容,但是位于节点之间的内容无法获取到,这个时候就可以通过 text() 与 string() 方法来获得其中的文本。

通过 text() 获取某个节点中的文本

In [1]: page.xpath('//li/a[3]/text()')
Out[1]: ['霸道总裁爱上我', '斗罗大陆']
#通过 text() 属性可以很轻松的获取标签之间的文本。

通过 string() 获取某个节点中的文本

In [1]: page.xpath('string(//li[1]/a[3])')
Out[1]: '霸道总裁爱上我'

5、选取多个路径

需要同时查找多个条件时可以通过在路径表达式中使用管道符("|"),选取若干个路径

In [1]: page.xpath('XXXXXXX | XXXXXXXtext()')
Out[1]: ['']

Python操作lxml库文章集合

Python操作lxml库(基础篇)

Python操作lxml库(Xpath篇)

  • 7
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

醉蕤

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值