xml encoding和实际编码不同导致xml解析异常

发现一个xml encoding和实际编码不同导致xml解析异常。

对于
<?xml version="1.0" encoding="GBK" ?><a>市</a>
使用了utf-8 getBytes后得到一个byte[],然后使用xml解析。
由于xml解析器会自动识别xml中的GBK,然后使用GBK解码,导致xml解析失败。


<?xml version="1.0" encoding="GBK" ?><a>市</a>
utf-8
3C3F786D6C2076657273696F6E3D22312E302220656E636F64696E673D2247424B22203F3E3C61 3E E5B8 82 3C 2F61 3E
gbk
<?xml version="1.0" encoding="GBK" ?><a>甯?/a>
3C3F786D6C2076657273696F6E3D22312E302220656E636F64696E673D2247424B22203F3E3C61 3E E5B8 3F 2F61 3E

可以看到,由于编码问题,市的utf-8编码E5B882和<的utf-8编码3C被GBK解码时,
解析为E5B8, 3F(不能识别,默认?),导致</a>中的<被提前解析到text中,导致后续xml解析找不到<,解析失败。

16进制码值 打印字符
2F61 /a
61 a
3C <
3E >
3F ?
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值