xerces-c开发中,汉字编码验证准确性

 经常有朋友用xerces-c开发程序,生成了gbk,或者gb2312编码格式的xml报文,汉字被编码为如下的样子,文件名test.xml:

<?xml version="1.0" encoding="GBK" standalone="no" ?>
<InterBOSS>

  <UserInfo>
    <BizCode>125829999</BizCode>
    <ProdName>&#xC5;&#xA9;&#xD5;&#xFe;&#xCD;¨</ProdName>
    <ServCode>1258299993100001</ServCode>
    <UserData>
      <MobNum>13777451607</MobNum>
      <OprCode>01</OprCode>
      <EfftT>20090101</EfftT>
    </UserData>
  </UserInfo>

</InterBOSS>

怎样来验证报文中的汉字编码转换是正确,如果能通过程序将ProdName中的汉字编码正确地显示出来,证明转换没有错。

xerces-c的例子中,DOMPrint可以打印出不同编码格式的xml文件,并正确显示。

验证方法,执行如下格式的命令验证test.xml

./DOMPrint -wenc=iso8859-1  test.xml

如果能在屏幕上准确地打印出汉字,那么表示生成的报文中,汉字的编码没有问题。

如果打印出乱码,那么生成的报文有问题,仔细查看代码中,那些地方没有做好编码转换。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值