XML文件中的内容都在一行时,使用dom4j解析XML的过程。

在实际工作中,遇到了对方发给我方的 XML 文件内容都处于一行中。


初始思路:

将文件中的内容读取到系统中,使用 dom4j 的 asXML() 方法将文件中的内容变为字符串。

Document fromXml=reader.read(new FileInputStream(new File(xmlPath))); 
String asXML = fromXml.asXML();

然后将字符串按 XML 格式进行换行处理。
最后对处理后的字符串进行解析。

问题:

但是在最后解析的过程中,发现 XML 中有 CDATA 标签
而 dom4j 解析字符串的时候,代码无法识别 CDATA 标签。所以一直吧他当子标签处理。

解决:

最终,使用 文件读取的方式。将处理好的字符串,生成到新的 XML 文件中,并且规定好格式。并且对这个新 XML 文件进行解析,获取系统需要的数据。

    Writer writer = null;
    BufferedWriter bw = null;
    String[] split = asXML.split("><");
    try {
        writer = new FileWriter(newXmlPath);
        bw = new BufferedWriter(writer);
        for (int i = 0; i < split.length; i++) {
            if (i == split.length-1) {
                bw.write(split[i]);
            }else if(split[i+1].contains("![CDATA[")){
                bw.append(split[i]+"><");
            }else if(split[i].contains("![CDATA[")){
                bw.append(split[i]+"><");
            }else {
                bw.write(split[i]+">\n<");
            }
        }
        bw.flush();
    } finally {
        bw.close();
    }

注意:

错误格式:

<a note="note"><![CDATA[a.rar]]>
</a>

<a note="note">
<![CDATA[a.rar]]>
</a>

正确格式: (必须处于一行才可以解析出 CDATA 中的数据)

<a note="note"><![CDATA[a.rar]]></a>

详细的代码
https://github.com/ITzhaowen/XmlToStr

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值