使用python开发时,由于python的开源生态圈非常的给力,对于实现同一个功能,往往在这方面的类库非常多,而开发者也同样面临着如何选择最佳的 类库作为辅助开发的工具。本文将记录本人在使用python处理xml格式数据时测试过的类库,有些类库由于先天不足,无法支持一些特性,涉及的类库或模 块有xml(python自带)、libxml2 、lxml 、xpath 。
附注:本文处理xml格式的数据的结构如下:
Python代码
input_xml_string = """ 1.0 " url="http://***" /> <data version="2.0" url="http://***" /> item> <data version="1.0" url="http://***" /> <data version="2.0" url="http://***" /> other> root> """
python自带的xml处理模块xml.dom.minidom 解析xml
可以使用该模块提供的”getElementsByTagName“接口找到需要的节点,实例“get_tagname”如下:
Python代码
import xml.dom.minidom def get_tagname(): doc = xml.dom.minidom.parseString(input_xml_string