解析异常SAXParseExceptionis如何处理


1.问题背景

今天一位同事找我寻求帮助,售后向他反馈的问题不知道如何排查,他尝试分析服务器端日志文件, 但是日志文件中并没有报错信息,查询源码时候发现,报错信息被try...catch处理

2.排查过程

顺便提一句, 排查问题时候需要记住一句话:“相信日志, 相信数据、相信代码, 不要相信售后的嘴”。

没有报错日志,那么就先分析源码。 通过现有业务功能和日志文件中仅有的操作日志, 定位问题在某个订单处理过程中,我们发现只有某个客户存在问题,其他客户正常,断定是数据问题,因此我尝试了解订单数据,以便了解客户办理的业务信息,在这个过程中发现了可疑点。 

订单的详情内容XML 以CLOB方式存储, 在PLSQL中查看CLOB对象的时候, 发现存在错误提示,从信息看解析字符串异常


Error: 无效的 unicode 字符。
Line: (93)
Text: <remark>&#x0;</remark>
File:

查看订单内容信息,发现订单详情中缺失存在<remark>&#x0;</remark>,remak是用来记录一些备注信息,

          <createOperator>
            <version>0</version>
            <mustBindTerminal>false</mustBindTerminal>
            <isVIPOperator>false</isVIPOperator>
          </createOperator>
          <modifyOperator>
            <version>0</version>
            <mustBindTerminal>false</mustBindTerminal>
            <isVIPOperator>false</isVIPOperator>
          </modifyOperator>
          <remark>&#x0;</remark>
          <operationTerminal>
            <version>0</version>
          </operationTerminal>
          <operationSpot>
            <id>1484</id>
            <version>0</version>
          </operationSpot>
          <version>0</version>
          <code>000006816211</code>

订单的详情内容在Oracle数据库中以CLOB方式存储。 什么时候CLOB呢?Oracle 存储字符串一般使用VARCHAR2 变量类型,当大于其最大字节长度时候(网络上很多人说最大字节长度为32767),需要使用大数据类型来存储,也可以叫大对象类型( Large Object)。CLOB类型的最大优势就是容量大,最多能容纳4GB的数据。 

了解这些信息后, 尝试重现问题, 测试环境中找了1条类似的记录,将订单的对应字段修改为"&#x0" , 程序中取消try..catch处理,复现了现场问题, 查看日志发发现,日志中明确显示了XML中存在字符"&#x0"  造成解析XML错误

Caused by: org.xml.sax.SAXParseException; lineNumber: 93; columnNumber: 24; Character reference "&#x0" is an invalid XML character.
	at org.apache.xerces.parsers.DOMParser.parse(Unknown Source)
	at org.apache.xerces.jaxp.DocumentBuilderImpl.parse(Unknown Source)
	at com.thoughtworks.xstream.io.xml.DomDriver.createReader(DomDriver.java:108)
	... 122 more

3.解决方法

因为字符解析引发的问题, 因此通过replace函数将问题字符串替换为可解析的字符串即可

Replace() 函数是用另外一个值来替代串中的某个值

  • 函数:replace()
  • 含义:替换字符串
  • 用法:replace(原字段,“原字段旧内容“,“原字段新内容“)

需要注意的是使用下面的SQL无法达到解决问题的效果

update orderinfo o
   set o.ordercontent = replace(o.ordercontent,"&#x0", 'null')
where o.orderid = 61926418

字符 "&#x0"中的&会被oracle当做变量来处理,例如下面的SQL执行结果如下

--测试
select '&#x0;' from dual;

执行结果: 

为了解决此问题就需要用到Oralce的转义操作,在SQL语句中通过chr(38) 来替换字符&,参考SQL

--测试
select chr(38)||'#x0;' from dual;

执行结果:

&#x0;

最终使用以下方式解决问题

update orderinfo o
   set o.ordercontent = replace(o.ordercontent, chr(38)||'#x0;', 'null')
where o.orderid = 61926418

4. 文章总结

通过本次问题处理需要记住以下几点

  1. 使用try..catch捕获异常,一定要打印日志,排查问题时才会更加顺利
  2. 大数据CLOB最大的优势为容量大,
  3. SQL 中可以使用chr(38) 来替换特殊字符 “&”


上一篇:Log4j2安全 JNDI漏洞 CVE-2021-44228

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

=PNZ=BeijingL

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值