Java解析xml文件遇到特殊符号&会出现异常的解决方案

原创/朱季谦

在一次Java解析xml文件的开发过程中,使用SAX解析时,出现了这样一个异常信息:

Error on line 60 of document : 对实体 "xxx" 的引用必须以 ';' 分隔符结尾;

我打开xml文件后,发现该“xxx"符号之前跟着一个”&“符号,后来了解到,这类符号在xml里属于一种特殊符号,而特殊符号若没用转义符表示,直接用到xml文件里,就会在使用SAX等方式做解析时出现奇怪的异常。

其实,这都是因为这些特殊字符造成的。

XML当中特殊符号包括< > & ' "等,它们是不允许作为xml文件的PCDATA,若想使用话,需用转义符代替:

&lt;    <
&gt;    >
&amp;   &
&quot;  "
&apos;  '

那么,若要正常读取xml文件数据,应该如何使用转义符替换呢?

刚开始是想百度一番如何解决,却发现好多帖子都是好几年前的,且都没有写清楚怎么个解决方法,大多都是提到是特殊符号引起的解析异常,但怎么过滤掉,显得含糊其辞,因此,只能自己胡乱捣鼓一番,捣鼓出一个比较合适的将特殊字符过滤的方案。

实现思路其实很简单,我们可以在读取xml文件使用SAX解析前,先把xml文件通过Reader读取,然后按行读取出来拼接成一个String字符串,再使用字符串的替换方法replaceAll()将特殊符号进行替换,替换后,就可以将字符串形式的xml直接转成Document对象做xml解析了:

  String xmlStr=s.replaceAll("&","&amp;");

转换方法代码如下:

  StringBuffer buffer = new StringBuffer();
  BufferedReader bf= new BufferedReader(new FileReader("D:\\测试.xml"));
  String s = null;
     while((s = bf.readLine())!=null){
     buffer.append(s.trim());
  }

  String str = buffer.toString();
  //在这一步进行字符替换,替换成合法转义字符
  String xml=str.replaceAll("&","&amp;");

  //这里就可以将处理过的xml文件进行读取解析了
  Document document =  DocumentHelper.parseText(xml);

至此,就可以解决Java解析xml文件遇到特殊符号&出现异常的问题了。

  • 10
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Java可以使用多种方式来解析XML格式文件,常用的有DOM和SAX两种解析方式。 DOM(Document Object Model)是将整个XML文档以树形结构加载到内存中的解析方式。它将XML文档解析为一个包含节点对象的树,通过遍历树的节点来获取和操作XML文档的内容。DOM解析方式相对简单,适用于小型XML文件或需要随机访问多个节点的情况。但是,由于将整个XML文档加载到内存中,所以对于大型XML文件来说,占用大量内存,并可能导致内存溢出。 SAX(Simple API for XML)是基于事件驱动的解析方式。在SAX解析中,当解析遇到XML文件中的节点时,它触发事件,然后将事件交给事先注册的事件处理程序进行处理。SAX解析方式不需要将整个XML文档加载到内存中,适用于处理大型XML文件。然而,由于SAX是基于事件的,所以只能按顺序读取XML文档而不能随机访问节点。 除了DOM和SAX,还有一些其他的Java解析库可用于解析XML文件,如JDOM、StAX和XPath等。JDOM是基于Java Collections框架的解析库,提供了简单易用的API;StAX是一种流式解析方式,类似于SAX,但API更加易用;XPath是一种用于在XML文档中定位节点的查询语言。 通过使用这些Java解析方式,我们可以方便地读取和操作XML格式的文件,提取其中的数据并进行处理,使得我们能够轻松地与其他系统进行数据交互。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

朱季谦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值