作为开发人员,或许听说过“神奇的联通乱码现象”。没有听说也没有关系,那什么是“联通乱码现象”?到底是什么原因造成这个现象产生呢?
本文帮你彻底答疑解惑,当你理解“联通乱码现象”的根源后,其实也就真正加深了对中文乱码的解决之道。
有个很著名的奇怪现象:当你在 windows系统 的记事本里新建一个空白文件,在文件里输入"联通"两个字之后保存,关闭文件后再双击打开。观察到什么了吗?输入“力挺联通”,保存后再双击打开,又会如何呢?
输入“联通”两个字的时候:
输入文字时是正常的
保存并关闭文件,双击打开后的结果:
双击打开记事本,显示乱码
输入“力挺联通”四个字的时候:
输入文字时是正常的
保存并关闭文件,双击打开后的结果:
双击打开记事本,显示乱码
你会发现,明明输入的是正确的文字,但是关闭后再双击打开文件,发现文字消失,取而代之的是几个乱码!为什么会这样呢?
大家知道,记事本是微软的产品。莫非联通得罪了微软?
为了能透彻理解这个奇怪的现象,一定要透彻理解字符编码,尤其是UTF-8编码格式。
接下来让我们来分析一下计算机对UTF-8文件的解码过程。掌握了UTF-8文件的解码过程,那么就具有了解释“奇怪的联通现象”的技术基础了。
好吧!说干就干。
有一个UTF-8编码的文本,文本内容为:“a0一” 。
分别是英文字