简述中文乱码产生的原因

经常听别人说编码方式不一致是导致乱码产生的原因。这是标准答案,但不一定是你想要的答案,因为不理解啊!那就说的再明白一点。

你知道一个中文字符在网络上是怎么传输的吗?比如“中国”这两个字,猜一下也知道在传输过程中肯定不是“中国”这样的字符,而是字节,也就是0|1这样的二进制数。

你需要把“中国”通过某种编码方式转换成二进制数进行传输,而接收方在收到二进制数之后再根据相应的编码方式解码成“中国”。问题就出在双方使用的编码方式是否一致上面。

编码方式是什么东西?听说过字符集吧?常见的字符集有UTF-8,GBK,GB2312,ISO8859-1之类的。每种字符集都会在它所包含的字符和字节之间建立映射关系。而一个字节就是8个二进制位。所以你也可以把字符集看成是字符和二进制数进行转换的公式或映射表。

“中国”用GBK转成二进制数是11010110110100001011100111111010(在GBK中每个中文字符对应两个字节,每个字节对应8位二进制数,因此这串数字应该是32位,对应“中国”这两个中文字符,不信你可以数数,呵呵。),再把这一串二进制数用UTF-8转换成字符试试,肯定不是原来的“中国”了(因为在UTF-8字符集中,一个字符对应三个字节,所以用脚趾头都能猜到肯定找不回“中国”了)。这就是我所理解的中文乱码产生的原因。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值