不同编码格式汉字占用的字节数不同

      在写这边文章之前,一直以为所有的汉字不管编码是什么,都是占用两个字节。并且在工作中使用到判断字节数或者接口报文长度时也没有出错,所以这个知识点一直就被默认为正确的。

      直到今天,在工作中遇到一个问题,才发现原来不同的编码,汉字占用的字节数是不一样的。比如:UTF-8编码下汉字占用的字节数是3;GBK编码一个汉字占用的字节数是2。

      发现过程:在进行接口测试的时候,有一个测试点为定长报文头中有一个字段为报文xml的长度,并且这个字段的值会根据后面报文每个字段的取值变化。但是测试时发现无论使用什么工具去看xml报文的长度,都是和定长报文中xml长度字段的值不相等。直到问了开发才发现是编码导致的问题。因为该项目的其他接口解析的时候都使用的是GBK编码,为了配合交互系统,该接口解析的时候使用UTF-8编码才不会出现乱码,故导致了这个问题。

 

     

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值