作为开发人员,或许听说过“神奇的联通乱码现象”。没有听说也没有关系,那什么是“联通乱码现象”?到底是什么原因造成这个现象产生呢?
本文帮你彻底答疑解惑,当你理解“联通乱码现象”的根源后,其实也就真正加深了对中文乱码的解决之道。
有个很著名的奇怪现象:当你在 windows系统 的记事本里新建一个空白文件,在文件里输入"联通"两个字之后保存,关闭文件后再双击打开。观察到什么了吗?输入“力挺联通”,保存后再双击打开,又会如何呢?
输入“联通”两个字的时候:

输入文字时是正常的
保存并关闭文件,双击打开后的结果:

双击打开记事本,显示乱码
输入“力挺联通”四个字的时候:

输入文字时是正常的
保存并关闭文件,双击打开后的结果:

双击打开记事本,显示乱码
你会发现,明明输入的是正确的文字,但是关闭后再双击打开文件,发现文字消失,取而代之的是几个乱码!为什么会这样呢?
大家知道,记事本是微软的产品。莫非联通得罪了微软?

为了能透彻理解这个奇怪的现象,一定要透彻理解字符编码,尤其是UTF-8编码格式。
接下来让我们来分析一下计算机对UTF-8文件的解码过程。掌握了UTF-8文件的解码过程,那么就具有了解释“奇怪的联通现象”的技术基础了。
好吧!说干就干。
有一个UTF-8编码的文本,文本内容为:“a0一” 。
分别是英文字母“a”,数字“0”,中文汉字“一”。接下来我们来分析一下这个文件,计算机是如何识别的吧。
一.获取十六

本文深入剖析了'联通'乱码现象的产生原因,揭示了UTF-8编码和GB2312编码冲突导致的误解。通过分析文件的编码过程,展示了如何正确理解与解决中文乱码问题。通过实例,读者可以了解到如何避免类似乱码现象的发生。
最低0.47元/天 解锁文章
8773

被折叠的 条评论
为什么被折叠?



