// 双斜杠 定位根节点,会对全文进行扫描,在文档中选取所有符合条件的内容,以列表的形式返回。
//从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
# !/usr/bin/env python
# -*- coding: utf-8 -*-
from lxml import etree
# 获取文件元素
from lxml import etree
# 获取文件元素
htmlEmt = etree.parse('text.xml')
# 获取所有的 <li> 标签
result = htmlEmt.xpath('//li')
print(result)
print type(result)
for x in result:
print x
print type(x)
print x.text
C:\Python27\python.exe C:/Users/TLCB/PycharmProjects/untitled/xpath/l1.py
[<Element li at 0x26da9e0>, <Element li at 0x26da198>, <Element li at 0x26da030>, <Element li at 0x26da0d0>, <Element li at 0x26da238>]
<type 'list'>
<Element li at 0x26da9e0>
<type 'lxml.etree._Element'>
a0
xpath //
最新推荐文章于 2024-09-25 16:51:14 发布
本文深入探讨了XPath中的'//'符号,它用于选取文档中的所有节点。无论层级多深,只要匹配给定的模式,'//'都能找到它们。通过实例解析,我们展示了如何有效地使用此符号进行XML和HTML文档的查询,从而提升数据提取和处理的效率。
摘要由CSDN通过智能技术生成