gb18030编码格式了解和应用

本文探讨了在处理银行业务报文时遇到的编码问题,通过分析UTF-8和GBK编码的局限性,特别是针对维文字符的乱码现象,深入研究了各种中文编码格式,如GB2312、BIG5和GBK。最终确定GB18030编码由于其支持更多字符,包括四字节编码的维文,从而解决了乱码问题,证明了GB18030编码的适用性。
摘要由CSDN通过智能技术生成

编码格式经常用的有UTF-8、GBK,之前用eclipse开发的时候默认格式就是GBK,现在换成AS后默认格式变成了标准的UTF-8。最近做银行业务发现其报文用16进制字符串转成byte数组后,再分别用UTF-8和GBK转码都会有乱码的情况出现。使用UTF-8转码时由于全部是乱码因此判定UTF-8编码肯定是不规范的,使用GBK转码发现有部分字是乱码于是进入正文开始了对编码格式的研究。

   乱码的部分是维文,通过度娘了解到一个维文是由四个字节组成,与在GBK编码下一个汉字两个字节不同。便假设维文采用的Unicode编码经测试发现假设是错误的,于是又转到gb编码上来寻找合适的编码格式。一下是搜索到的中文编码格式。

  GB2312编码:1981年5月1日发布的简体中文汉字编码国家标准。GB2312对汉字采用双字节编码,收录7445个图形字符,其中包括     6763个汉字。 

  BIG5编码:台湾地区繁体中文标准字符集,采用双字节编码,共收录13053个中文字,1984年实施。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值