使用的fastjson版本 1.1.38
1 排查异常
代码打印的异常是读取redis数据之后,fastjson解析出错。将出错代码抽取出一个测试方法,在线上环境进行循环调用来复现问题。
完成代码抽取之后,在循环执行的过程中代码会随机出错,问题没有每次必现。由于升级并没有涉及相关代码的更改,刚开始着重点在排查jar包冲突。通过删除一部分jar包之后问题缓解,但是并没有彻底解决问题。
由于升级过程中涉及两个操作,1,更改hbase实现代码;2,升级jdk版本到1.7 。在排查代码没有头绪的背景下,开始排查jdk版本问题。相同的测试代码在jdk1.6下运行不会出错,但是1.7会有问题。此时推断现有的fastjson版本在jdk1.7下运行会有问题,在尝试更换不同版本jar包后问题仍然存在。
2 fastjson debug
由于必须升级jdk1.7,所以决定开始调试fastjson源码来确定问题点。但是由于问题不是每次都发生,并且调试过程是在win环境下的jdk版本下进行。造成调试过程中始终不出现线上发生的问题。
此时只能按照正常执行的方式进行debug,看看问题可能会出现在哪几个地方。同时在可能出现的问题的代码点添加log信息,重新编译jar包后在线上运行。看看线上运行异常时输出的结果是否与正常运行的情况下产生的一样。
首先发现的是value字段的解析器对象创建错误。
正常情况下,value字段会执行到418行并判断为true,返回ArrayDeserializerd对象对value字段进行解析。线上有问题时该行会判断为false,最后执行到代码430行产生了错误的对象解析器。
在确定了问题代码后,便开始对方法传入的参数进行判断&#