xml解析技术

XML解析技术

在这里插入图片描述

Xml(可扩展标记语言)全称:extened Markup Language 可扩展的含义:允许程序员按照自己的想法去扩展新的标签
扩展时,需遵循XML规范。
Xml特点:
自带描述性
可支持跨平台
保留了面向对象编程的层次感
编写xml的语法:
1、 头,也称序言 包含了(文档声明 注释 空白)
2、 文档元素包含(注释,空白,标签,内容,标签描述)

在这里插入图片描述
注释的作用告诉xml解析器,不要解析
空白的使用:
在xml中,可以使用空格,制表符,回车等等的方式让结构更加的清晰
Xml的文档元素:
<开始标签>内容</结束标签>如:
张三
元素是整个文档中最基本的数据存储单位或者逻辑单位
定义标签时,需遵循以下规范:
1、 标签名的定义,可以使用中文,英文,数字,下划线 但是名称必须使用下划线或者字母开始(数字不能开始,下划线中文不推荐使用)
2、 每一个xml 文档中一定要根标签 根标签内部可以扩展子标签
3、 每一个xml文档中,至少需要存在1个标签元素 否则该文档就没有存在的含义。
4、 定义标签名时,一定不能在名称中使用空格 冒号 !;等等其他的符号
5、 定义标签名时,一定不要再名称中包含xml或者xml.等内容。
元素内容:
1、 字符数据 所有的中英文 数字 各种符号,需注意< > & ‘ “
2、 嵌套标签(嵌套元素)
3、 实体所谓的实体就是<>&’ ”符号的替代
< 你应该用<

你应该使用&glt;
& 你应该使用&
“ 你应使用"去替代它
‘你应该使用'去替代它

4、 静态语句块

<![CDATA[]]>

告诉xml解析器,内部没什么特殊含义,就是一个普通的字符串
元素还可以添加属性:
属性的作用:进一步修饰该元素
定义属性名称的时候,也需要遵循一定规则:
1、 属性名称可以包含字母,下划线 中文(但是不推荐使用中文)不能包含<>;”’等无法识别的符号
2、 属性名不能重复
3、 属性名严格区分大小写
4、 定义属性名时一定不能包含xml(XML)及xml.和.xml
5、 属性定义的方式,采用k-v键值对进行定义如type=”String”,值必须包含在“”内,引号必须成对出现
规范格式:
DTD Schema
XML的解析技术: DOM/SAX ------完成oxM opject-XML-Mapping
DOM文档对象模型,采用树形结构来完成对文档的解析,它在解析时,会将整个文档加载内存中,然后形成"节点树"当文档内容过多,或者是需要解析的文档太多,此时可能会造成服务器内存紧张的问题。
SAX基于事件驱动模式下的文档解析技术

DOM4J框架,针对DOM和SAX的解析技术,目前使用较为广泛。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值