理解XML DOM树结构

文章介绍了XML文档的DOM树结构,讨论了如何通过Java代码获取并操作DOM节点,特别提到节点和元素的区别,以及常见的DOM操作方法。作者还分享了个人在整理Java开发学习资料的经验,强调系统学习的重要性。
摘要由CSDN通过智能技术生成
<class studentid="16">98211</class>
<birthday>
<day>3</day>
<month>3</month>
<year>1980</year>
</birthday>
</student>
</students>
我们很自然想象到能得到如下图的结构,但是这只是数据的描述,而不是DOM树的结构。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

我们可以通过以下的代码得到上面的XML文档的根结点和根结点下孩子节点的数目。
import javax.xml.parsers.*;
import org.w3c.dom.*;
import java.io.File;
import xmlwriter.XMLProperties;
public class Xml
{
public static void main(String args[])
{ try
{ File file=new File("links.xml");
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc=builder.parse(file);
doc.normalize();
Element theRoot = doc.getDocumentElement();
NodeList theList=theRoot.getChildNodes();
System.out.println("the students root has "+theList.getLength()+" children");
}
}
}

结果显示为:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

但是从上面XML文档可以看出,students一共只有3个孩子节点(包括注释),但程序得到的结果确实有7个孩子结点。为什么呢?因为在DOM中节点和元素不是等价的,它的7个节点包括:两个student元素、注释及它们周围的文本节点。这些文本节点有可能是回车换行、空格或者退格,假如把这些回车换行、空格和退格都删除,那么DOM解释的时候就没有这些文本节点,孩子节点就真的只有3个了。下图是DOM树的精确描述:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

三.常见的基本节点类型:文档、元素、属性、文本和注释
XML 中共有12种节点类型,其中最常见的节点类型有5种:
元素:元素是 XML 的基本组成单元。,描述XML的基本信息。
属性:属性节点包含关于元素节点的信息,通常包含在元素里面,描述元素的属性。
文本:包含许多文本信息或者只是空白。
文档:文档节点是整个文档中所有其它节点的父节点。
注释:注释是对相关的信息进行描述、注释。
四.常见的基本方法:
通过Jaxp包来解释XML文档后,对DOM的节点对象的基本操作有:
appendChild(Node newChild):在本节点上增加一个新的孩子到孩子列表的后面。
getAttributes():得到本节点的属性列表,返回类型为NamedNodeMap。
getChildNodes():得到本节点的孩子列表,返回类型为NodeList。
getFirstChild()、getLastChild():得到第一个和最后一个孩子节点。
getNextSibling()、getPreviousSibling():得到本节点的下一个和前一个兄弟节点。
getNodeName()、getNodeType()、getNodeValue():得到本节点的名称、类型和值。
getParentNode():得到本节点的父亲节点。
insertBefore(Node newChild, Node refChild):在本节点的refChild孩子节点前插入一个新的节点。
removeChild(Node oldChild):删除oldChild孩子节点。
以上列出对DOM树操作的一些常用的基本的方法,还有很多其他的方法,读者可以参考有关的规范。
五.递归遍历DOM树
DOM树结构和二叉树很相似,元素的孩子节点集合就是该元素的分支,但是属性节点不是元素的子节点,它只是描述该元素节点的一些性质而已,属于元素节点结构内部的一部分。以下是用java编写的一段遍历DOM的程序:
public class RecurDOM(NodeList nodelist)
{
Node node;
int i;
if(nodelist.getLength() == 0)
{
// 该节点没有子节点返回
return;
}
for(i=0;i<nodelist.getLength();i++)
{
node = nodelist.item(i);
if(node.getNodeType() == Node.ELEMENT_NODE)
RecurDOM(node.getChildNodes());//递归调用
}
}
六.小结:

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

如果你觉得这些内容对你有帮助,可以扫码获取!!(备注Java获取)

img

最后

整理的这些资料希望对Java开发的朋友们有所参考以及少走弯路,本文的重点是你有没有收获与成长,其余的都不重要,希望读者们能谨记这一点。

image

image

其实面试这一块早在第一个说的25大面试专题就全都有的。以上提及的这些全部的面试+学习的各种笔记资料,我这差不多来回搞了三个多月,收集整理真的很不容易,其中还有很多自己的一些知识总结。正是因为很麻烦,所以对以上这些学习复习资料感兴趣
《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!
图片转存中…(img-dKxOGmv7-1713757218133)]

[外链图片转存中…(img-8e6Wvsxt-1713757218133)]

其实面试这一块早在第一个说的25大面试专题就全都有的。以上提及的这些全部的面试+学习的各种笔记资料,我这差不多来回搞了三个多月,收集整理真的很不容易,其中还有很多自己的一些知识总结。正是因为很麻烦,所以对以上这些学习复习资料感兴趣
《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!

  • 15
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值