![60c11136d4599c8da3a6a456bb598b8a.png](https://i-blog.csdnimg.cn/blog_migrate/46f692bf5ca9df85cf1d26d664bca16c.jpeg)
![af95581fba68a41e425ba60c02ca221f.png](https://i-blog.csdnimg.cn/blog_migrate/a6f15587a29fa5d023cd2be3cfdec7a5.png)
XPath介绍
XML Path Language)是XML路径语言,它是一门在XML文档中查找信息的语言。XPath的选择功能十分强大,它提供了非常简明的路径选择表达式,另外,它还提供了超过100个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等,几乎所有我们想要定位的节点,都可以用XPath来选择。
XPath常用规则
![1fa33015073a7e8f6d11833d5984f234.png](https://i-blog.csdnimg.cn/blog_migrate/72f6865f1fbe3dedb362adb14d85894a.jpeg)
XPath实战
lxml库的安装:pip3 install lxml
这里我们以百度新闻为例子,首先通过etree.HTML(text,parser=None,base_url=None)方法构造了一个XPath解析对象,并对HTML文本进行自动补全。然后根据XPath的规则对具体的节点进行匹配并取出对应的值。
import