1. Xpath介绍
1.1 基本概念
- Xpath (XML Path Language) 是一种XML查询语言,能在XML树状结构中寻找节点。Xpath用于在XML文档中通过元素和属性进行导航
- xml是一种标记语法的文本格式,xpath可以方便的定位xml中的元素和其中的属性值。lxml是Python的一个包,包含了可以将html 文本转化为xml对象,和对对象进行xpath的能力
1.2 结点的关系
xml_content = '''
<bookstore>
<book>
<title lang='eng'>HerryBote</title>
<author>Kingdom.Peter</author>
<year>2012</year>
<price>1888</price>
</book>
</bookstore>
'''
print(xml_content)
上面的xml文档中的节点例子
- < bookstore > ( 文档节点 )
- < author > Kingdo