Java解析XML文件的方式，温故而知新

天使的键盘

于 2024-03-19 13:58:45 发布

阅读量889

点赞数 17

分类专栏： Java程序员文章标签： java xml python

本文链接：https://blog.csdn.net/m0_62261166/article/details/136840775

版权

Java程序员专栏收录该内容

8 篇文章 0 订阅

订阅专栏

18 if(books!=null){

19 for(int i=0;i<books.getLength();i++){

20 Node book=books.item(i);

21 //获取id属性

22 if(book.getNodeType()==Node.ELEMENT_NODE){

23 String id=book.getAttributes().getNamedItem(“id”).getNodeValue();

24 System.out.println(“id is:” + id);

25 //遍历book下的子节点

26 for(Node node=book.getFirstChild(); node!=null;node=node.getNextSibling()){

27 if(node.getNodeType()==Node.ELEMENT_NODE){

28 //依次读取book里的name,price和memo三个子元素

29 if(node.getNodeName().equals(“name”)){

30 String name=node.getFirstChild().getNodeValue();

31 System.out.println(“name is:” + name);

32 }

33 if(node.getNodeName().equals(“price”)){

34 String price=node.getFirstChild().getNodeValue();

35 System.out.println(“price is:” + price);

36 }

37 if(node.getNodeName().equals(“memo”)){

38 String memo=node.getFirstChild().getNodeValue();

39 System.out.println(“memo is:” + memo);

40 }

41 }

42 }

43 }

44 }

45 }

第19行的for循环里，我们是遍历book元素通过观察xml文件，我们发现book元素出现了2次，所有这个循环会运行两次，而且，book元素有1个id属性，所有我们需要通过第23行的代码，得到id属性的值。

在文档里，book元素有3个子节点，分别是name，price和memo，所以在代码的26行里，再次使用for循环遍历其中的子节点。在遍历时，我们通过29到32行的代码获取到了book元素里name的值，通过类似的代码后继的33到40行代码里得到了price和memo这两个元素的值。

46 } catch (ParserConfigurationException e) {

47 e.printStackTrace();

48 } catch (FileNotFoundException e) {

49 e.printStackTrace();

50 } catch (IOException e) {

51 e.printStackTrace();

52 } catch (SAXException e) {

53 e.printStackTrace();

54 } catch (Exception e) {

55 e.printStackTrace();

56 }

57 //在finally里关闭io流

58 finally{

59 try {

60 input.close();

61 } catch (IOException e) {

62 e.printStackTrace();

63 }

64 }

65 }

66 }

同样地，在解析完成后，在finally从句里，我们关闭了之前用到的IO流（input对象）。

3 基于事件的解析方式

SAX是Simple API for XML的缩写，不同于DOM的文档驱动，它是事件驱动的，也就是说，它是一种基于回调（callback）函数的解析方式，比如开始解析xml文档时，会调用我们自己定义的startDocument函数，从下表里，我们能看到基于SAX方式里的各种回调函数以及它们被调用的时间点。

函数名	调用时间点
startDocument	开始解析xml文档时（解析xml文档第一个字符时）会被调用
endDocument	当解析完xml文档时（解析到xml文档最后一个字符时）会被调用
startElement	当解析到开始标签时会被调用，比如在解析“<name>FrameWork</name>”这个element时，当读到开始标签“<name>”时，会被调用
endElement	当解析到结束标签时会被调用，比如在解析“<name>FrameWork</name>”这个element时，当读到结束标签“</name>”时，会被调用
characters	1行开始后，遇到开始或结束标签之前存在字符，则会调用 2两个标签之间，存在字符，则会调用，比如在解析“<name>FrameWork</name>”时，发现存在FrameWork，则会被调用 3标签和行结束符之前存在字符，则会调用

从上表里我们能看到characters方法会在多个场合被回调，但我们最期望的调用场景是第2种，这就要求我们最好在解析xml文档前整理下它的格式，尽量避免第1和第3种情况。在ParserXmlBySAX.java这个案例中，我们通过了编写上述的回调函数，实现了SAX方式解析xml文档的功能。

1 //省略import的代码

2 //基于SAX的解析代码需要继承DefaultHandler类

3 public class ParserXmlBySAX extends DefaultHandler{

4 // 记录当前解析到的节点名

5 private String tagName;

6 //主方法

7 public static void main(String[] argv) {

8 String uri = “src/book.xml”;

9 try {

10 SAXParserFactory parserFactory = SAXParserFactory.newInstance();

11 ParserXmlBySAX myParser = new ParserXmlBySAX();

12 SAXParser parser = parserFactory.newSAXParser();

13 parser.parse(uri, myParser);

14 } catch (IOException ex) {

15 ex.printStackTrace();

16 } catch (SAXException ex) {

17 ex.printStackTrace();

18 } catch (ParserConfigurationException ex) {

19 ex.printStackTrace();

20 } catch (FactoryConfigurationError ex) {

21 ex.printStackTrace();

22 }

23 }

在main方法的第8行里，我们指定了待解析xml文档的路径和文件名，在第10行里，我们创建了SAXParserFactory这个类型的SAX解析工厂对象。在第12行，我们通过SAX解析工厂对象，创建了SAXParser这个类型的解析类。在第13行，通过了parse方法启动了解析。

在上文里我们就已经知道，在SAX的方式里，是通过调用各种回调函数来完成解析的，所以在代码里，我们还得自定义各个回调函数，代码如下。

// 处理到文档结尾时，直接输出，不做任何动作

25 public void endDocument() throws SAXException {

26 System.out.println(“endDocument”);

27 }

28 // 处理到结束标签时，把记录当前标签名的tagName设置成null

29 public void endElement(String uri, String localName, String qName) throws SAXException {

30 tagName = null;

31 }

32 // 开始处理文档时，直接输出，不做任何动作

33 public void startDocument() throws SAXException {

34 System.out.println(“startDocument”);

35 }

36 // 处理开始标签

37 public void startElement(String uri, String localName, String name,Attributes attributes) throws SAXException {

38 if (“book”.equals(name)) { //解析book标签的属性

39 for (int i = 0; i < attributes.getLength(); i++) {

40 System.out.println(“attribute name is：” + attributes.getLocalName(i) + " attribute value：" + attributes.getValue(i));

41 }

42 }

小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数初中级Java工程师，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新Java开发全套学习资料》送给大家，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

由于文件比较大，这里只是将部分目录截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

如果你觉得这些内容对你有帮助，可以添加下面V无偿领取！（备注Java）

img-1R2lZIiy-1710827914186)]
[外链图片转存中…(img-VVsNXnDZ-1710827914186)]
[外链图片转存中…(img-VqKwKMEV-1710827914188)]

由于文件比较大，这里只是将部分目录截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

如果你觉得这些内容对你有帮助，可以添加下面V无偿领取！（备注Java）
[外链图片转存中…(img-pnieDMZj-1710827914188)]

天使的键盘

关注

17
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录