更改文件数据类型: 使用语法:#--coding:gbk-- (文件编码改为GBK)
ascii码占一个字节,Unicode统一占两个字节, utf-8:基于unicode扩展出来的可变长的编码方式,对于ascii码给一个字节的空间,
对于unicode给三个字节的空间
utf-8 <—–> Unicode(作为中介) <—–> GBK
utf8 —–> Unicode (decode) Unicode —–> utf8 (encode)
GBK —–> Unicode (decode) Unicode —–> GBK (encode)
Python 3.x中默认所有的字符都是Unicode
s = "你好" #因为Py 3.x中的默认编码是Unicode,所以及时更改了文件的数据类型,s仍然是以Unicode进行编码
print("Unicode",s)
s_gbk = s.encode("gbk")
print("utf-8",s.encode("utf-8")) #输出最前面有个b 代表bite
print("GBK",s.encode("gbk"))
gbk_to_utf8 = s_gbk.decode("gbk").encode("utf-8")
print("gbk-->utf-8",gbk_to_utf8)