XPath 语言丨Python爬虫基础入门系列(5)

本文介绍了XPath语言在Python爬虫中的应用,包括其学习目的、开发工具和基本语法。重点讲解了谓语条件、选取未知节点和选取若干路径等核心概念,并给出了XPath高级用法如模糊查询的示例。通过学习XPath,可以更高效地定位和处理XML文档中的数据。
摘要由CSDN通过智能技术生成

提示:文末有福利!最新Python爬虫资料/学习指南>>戳我直达


前言

简述
XPath(XML Path Language)是XML路径语言,它是一种用来定位XML文档中某部分位置的语言。


话不多说,开始学习
在这里插入图片描述

XPath 语言

学习目的

将HTML转换成XML文档之后,用XPath查找HTML节点或元素

比如用“/”来作为上下层级间的分隔,第一个“/”表示文档的根节点(注意,不是指文档最外层的tag节点,而是指文档本身)。

比如对于一个HTML文件来说,最外层的节点应该是"/html"。

XPath开发工具

XPath语法

XPath 是一门在 XML 文档中查找信息的语言。

XPath 可用来在 XML 文档中对元素和属性进行遍历。

<?xml version="1.0" encoding="ISO-8859-1"?>
<bookstore>
<book>
  <title lang="eng">Harry Potter</title>
  <price>29.99</price>
</book>
<book>
  <title lang&
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值