Day06—XPath与lxml库的应用

本文详细介绍了XPath的基本概念、语法及案例,讲解了lxml库的安装与使用,以及如何借助XPath Helper扩展在Chrome中快速定位XPath,提升爬虫开发效率。
摘要由CSDN通过智能技术生成

在网络爬虫的实战中,XPath和lxml库是两个强大的工具,它们可以帮助我们进行更精确的元素定位和数据提取,也是爬虫必学技巧之一。

本文将介绍XPath的概念和语法,并会给出示例和快速定位xpath的方法。

XPath必知知识

1. XPath简介

XPath,全称XML Path Language,是一种在XML和HTML文档中查找信息的语言。它允许开发者通过元素和属性进行导航,从而选择节点或者节点集。XPath表达式可以非常精确地指定我们需要的数据。

2.XPath语法

(1).选取节点

表达式 说明
节点名称 选取此节点的所有子节点
/ 从根节点开始选取直接子节点,相当于绝对路径
// 从当前节点开始选取后代节点,相当于相对路径
. 选取当前节点
选取当前节点的父节点
@ 选取属性节点

(2).常用的XPath函数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ztop

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值