python爬虫xpath教程_Python爬虫教程-21-xpath 简介

本文简要介绍了XPath在Python爬虫中的使用,包括XPath的基本概念、节点类型、路径表达式以及谓语的运用。XPath作为一种在XML文档中定位节点的语言,常用于数据提取。文中还提到了一些常用的XPath工具,如XPathHelper和XPathChecker,以帮助开发者更高效地编写和测试XPath表达式。
摘要由CSDN通过智能技术生成

本篇简单介绍 xpath 在python爬虫方面的使用,想要具体学习 xpath 可以到 w3school 查看 xpath 文档

xpath文档:http://www.w3school.com.cn/xpath/index.asp

Python爬虫教程-21-xpath

什么是 XPath?

XPath 使用路径表达式在 XML 文档中进行导航

XPath 包含一个标准函数库

XPath 是 XSLT 中的主要元素

XPath 是一个 W3C 标准

用途:它是一种用来确定XML文档中某部分位置的语言

XPath开发工具:

开源的XPath表达式工具:XMLQuire

Chrome 插件:XPath Helper

FIrefox插件:XPath CHecker

XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。但是XPath很快的被开发者采用来当作小型查询语言

在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点

<?xml version="1.0" encoding="UTF-8" ?>

Everyday Italian

Gidada De

2018

23

Python is Python

Food War

2008

83

Running

Klaus Kuka

2010

43

XPath 路径表达式

XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。

常用路径表达式:

70

实例:

70

谓语(Predicates)

谓语用来查找某个特定的节点或者包含某个指定的值的节点

谓语被嵌在方括号中

实例:

在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:

70

选取未知节点

XPath 通配符可用来选取未知的 XML 元素

70

实例:

70

选取若干路径

通过在路径表达式中使用“|”运算符,您可以选取若干个路径

实例:

70

- 图片来自w3school http://www.w3school.com.cn/xpath/xpath_syntax.asp

- 本笔记不允许任何个人和组织转载

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值