XML
特点:语法严格 完全区分大小写
java程序员需要掌握:xml的解析方式(xml读/java写)
xml涉及到的
—xsl 等同于css 以.xsl结尾
—DTD 约束xml文件中的标签 在xml文件中只能编写那些标签,那些变迁中只能编写哪些属性 这是一个单独的文件以.dtd结尾
—scheme DTD的新语法 比DTD编写更加的方便 约束xml文件
scheme也有单独的文件 以.xsd结尾
xml是可扩展的
<?xml Version="1.0" encoding="GBK"?>
<person-info>//根节点 只能有一个
<xml_name />
<!--xml文档中标签一定要有结束标记-->
<student>
<id>001</id>
<name><张三 /></name>
<age>18</age>
</student>
<!--xml当中属性一定要有属性值 并且使用引号包含-->
<teacher id='1' name="李四"/>
<student id='11' name="王五">
<desc>
<![CSATA[
这个学生来自... 他已经学习了<<敬爱啊编程思想>>
]]>
</desc>
</student>
<!--xml语言中开始标签和结束标签必须大小写一样的-->
<_student></_student>
<_student/>
</persion-info>
关于xml解析
无论哪一种编程语言 对xml文件解析都包括两种解析方式
*dom解析
*sax解析
DOM解析
原理:在开始解析xml文件的时候 将整个文件全部加载到内存中,在内存中编程语言将xml文件的映射成一个DOM数 这棵树就是一个对象 然后我们可以对这棵树上的任意节点进行增删改查操作,由于这棵树完全放在内存中 解析过去的节点可以再次解析 比较灵活
优点:灵活 解析过去的节点 可以再次解析
缺点:如果xml文件比较大 容易导致内存溢出 即使不会导致溢出 也会耗费大量的内存空间 内存少了 项目的运行效率就会降低
什么情况下选择DOM解析:
如果很灵活的操作每一个元素 选用DOM解析 但是注意文件要小点
SAX解析
原理:sax解析是基于事件驱动型的解析方式,他的解析不需要将整个xml文件全部装载到内存中 解析的时候有一个顺序 在xml文件中从上往下一次解析遇到的开始标签 表示方式的一个特定的时间 此时执行一段特定的程序 遇到结束标签又发生了特定的时间 此时 执行解析成功
优点:不需要装载xml文件 所以不会占用大量的内存 适合大文件
缺点:解析过去的阶段不能重复解析 除非从新从头开始
什么情况下用SAX:大文件
作为java程序员如何解析xml文件 解析xml文件的开源项目都包括哪些?
涉及到的开源项目:
DOM4j…
jdk自带一套 是实现w3c规范的
org.w3c.dom.;
org.w3c.sax.;
为了提高我们解析xml的效率 还涉及到Xpath
(是一种标签的匹配方式。类似于正则表达式。可以让我们快速定位xml中的某个标签)
解析xml文件涉及到:
DOM4j/JDOM/W3C…+Xpath