1.16 python xml介绍与解析

Xml

Xml简介(Extensible Markup Language),可扩展标记语言

特点:

1 xml与操作系统,编程语言的开发平台无关

2实现不同系统之间的数据交换(数据传输的一种工具)

作用:

数据交互

配置应用程序和网站

Ajax基石

树形结构 最外层的元素叫跟元素只有一个,其他的都是在根元素里面的子元素。

Xml文档内容有一系列标签元素组成

<元素名 属性名=“属性值”>元素内容</元素名>

空元素 <name></name>

语法:

属性值用双引号包裹

一个元素可以有多个属性

属性值中不能直接包含< ”&(不建议;’)

Xml编写注意事项

1  所有xml元素都必须有结束标签

2  xml标签对大小写敏感

3  xml必须正确的嵌套

4  同级标签以缩进对齐

5  元素名称可以包含字母,数字或其他字符

6 元素名称不能以数字或者标点符号开始

7 元素名称中不能包含空格

Xml中的转义符列表

<      &lt;

>      &gt;

“      &quot;

‘      &apos

 

Xml 解析器

解析器类型

1非验证解析器(检查文档格式是否良好)

2验证解析器(使用DTD检查文档的有效性)

DTD(document tupe define  文档类型定义,xml文档的一种验证机制,约束xml文件的节点)   

解析 xml技术

Dom解析

1 基于xml文档树结构的解析(文档对象模型)

2 适用于多次访问的xml文档

3 特点:比较消耗资源

Dom解析案例(把解析的xml整个加载到内存组织成object树)

例如一个xml文件

用dom解析步骤如下

1.  导入from xml.dom.mindom import parse模块

2.  然后解析这个xml文件   doc=parse(“xml文件名.xml”)这个doc就得到了整个dom文档树

3.  得到根节点 root=doc.documentelement(root就得到了根节点)

得到所有子节点  b=root.getElementsByTagName("子节点名字")

4.  遍历子节点

For I in b

print(p.getElementsByTagName("子节点名字")[0].childNodes[0].data)(childNodes【0】表示第一个字节点里面的值)
这样就成功的用dom解析出了xml文件 这就是dom解析
 

模块
2 加载xml文件  root=parse(“xml文件名”)
3得到所有的子节点  abc=root.findall(“字节点名字”)
4 遍历所有子节点 得到子节点下的内容
<span lang="EN-US" style="" font-size:15.0pt;"="">for p in abc:

    print(p.find("<span style="" font-size:"="">子节点名字").text)find是自带的一种方法,后面的text就表示要得到的是text内容)
这样就成功的解析了xml文件 以上是解析xml内容的两种方法
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值