先看案例:
案例一、
结果输出:
案例二、
使用二进制读取文件,读取出来是二进制,正常显示需要转换;使用utf-8是不能成功的;因为当时字符串编写成二进制没有使用utf-8所以无法显示;
案例三、
可以正常显示,足以说明当初将字符串编码成二进制使用的是gbk码;
字符串直接保存到本地,计算机采用自己默认的编码规则将字符串变成二进制存到本地(本地磁盘一定是二进制);案例中是gbk码;读取的时候,如果没有指定用二进制读取的时候,会用默认的码进行转换;如果指定的话,就将二进制直接复制过来;电脑打开之所以能正常显示,是因为电脑已经用了编码进行了转换;
案例四、
很显然gbk当然无法编码utf-8规则的进制;
案例五、
read函数是先用gbk码将二进制转换成字符串;转换失败;
案例六、
以指定的正确编码打开可以正常显示;
这种方式就可以保证保存的文件不受系统编码的影响;
结论:1、当以二进制保存文件,打开仍然能正常显示,是因为系统以某种编码打开了,所以能正常显示;所以以二进制保存文件本质是只是告诉了系统不要使用默认的编码规则进行转码;因为文件保存到本地,一定要二进制才能保存,如果指定二进制保存方式 ,本质上是跳过了系统默认的转码,直接保存;2、当读取文件时,和保存是刚好对称的;首先读取磁盘的二进制文件,然后根据指定的方式,是否要以系统的自带编码规则进行解码;如果以“rb'方式 ,那么就跳过系统解码这一步,直接返回二进制数据;能否正常显示,就在于是否能正解解码;如果utf-8保存,那么 以utf-8就一定能解码;gkb解码就会乱码;