XML(可扩展标记语言),是互联网数据传输的重要载体,它不受系统和编程语言的限制。可以说它是一个数据携带者且具有高级别通行证。XML传递的具有结构化特征的数据是系统间,组件间得以沟通交互的重要媒介之一。
编程实践中,XML不仅可以用来标记数据,还可以用来定义数据类型等。XML提供统一的方法来描述和交换结构化数据。XML具体的主要用途主要表现在如配置应用程序和网站、数据交互等。如下源码是一个XML文件示例,user.xml。
<?xml version="1.0" encoding="UTF-8" ?>
<users>
<user id="1000001">
<username>Admin1</username>
<password>Admin1</password>
</user>
<user id="1000002">
<username>Admin2</username>
<password>Admin2</password>
</user>
</users>
根据以上XML源码,分析XML文件结果如下:
- XML声明部分一般位于XML文件的第一行且声明一般包括版本号和文档字符编码格式。如上例所示,XML文件遵循的是“1.0”版本的标准其字符编码格式为“UTF-8”。
- XML文档的根元素,是XML文档中唯一存在的。它的开始标签位于文档最前面而结束标签位于文档最后。如上例中,<users>和</users>是文档的根元素。
- 所有的XML元素都必须有结束标签。
- XML标签对大小写敏感。
- 在XML文件中一些字符拥有着特殊意义,不能够直接使用,容易造成文件格式错误
读取user.xml中的用户信息,可以先用DOM解析XML,再用getElementsByTagName方法获取user标签内容。user.xml中有两个user,第一个user内容用list[0],获取其(根元素)属性用getAttribute方法,子标签用getElementsByTagName方法。读取XML文件的源码如下:
#学习有疑问请联系作者
#作者qq:2574674466
#作者邮箱2574674466@qq.com
import xml.dom.minidom
dom=xml.dom.minidom.parse("user.xml")
root= dom.documentElement
ls=root.getElementsByTagName("user")
print(ls[0].getAttribute("id"))
print(ls[1].getElementsByTagName("password")[0].childNodes[0].nodeValue)
for l in ls:
print(l.getElementsByTagName("password")[0].childNodes[0].nodeValue)
视频、学习笔记联系qq:2574674466更多内容请关注公众号:“大牛测试