目录
XPath简介:
XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。
XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于Xpointer与XSL间的语法模型。但是XPath很快的被开发者采用来当作小型查询语言。
在此,我们学习最基本,最简单容易上手的使用XPath爬取数据。
Step 1:下载lxml
常见的方式是在windows系统上win+R调出运行,输入cmd进入控制台。
输入指令pip list可以看见目前已经安装的包
下载lxml包指令为:pip install lxml
由于下载包默认