python3编码方式问题

部分代码转载自https://zhuanlan.zhihu.com/p/40834093,详细python3编码方式见链接

一、python3

1、首先搞懂本地操作系统编码与系统编码的区别:

(1)本地操作系统编码方式是与操作系统有关的,linux默认的编码方式是utf-8,windos的默认编码方式是gbk

(2)系统编码方式是与编译器有关的,python3编译器的默认编码方式是utf-8,python2编译器的默认编码方式是ascii

2、python3头文件中的#coding='utf-8'的含义:

 指定python3的编译器以什么样的编码格式打开。
 
 3、编码方式并不仅仅代表编码,解码也包含其中,两者是相对应的。

示例代码:

import sys, locale

s = "小甲"
print(s)
print(type(s))
print(sys.getdefaultencoding())
print(locale.getdefaultlocale())

with open("utf1","w",encoding = "utf-8") as f:
    f.write(s)
with open("gbk1","w",encoding = "gbk") as f:
    f.write(s)
with open("jis1","w",encoding = "shift-jis") as f:    #shift-jis为日文编码格式
    f.write(s)

此时的输出:

小甲
<class ‘str’>
utf-8
(‘en_US’, ‘UTF-8’)

各个文件打开的结果:
utf1:小甲
gbk1:乱码
jis1:乱码
解释:

utf1:python3编译器以utf-8方式编码成二进制码,在写入文件的时候,操作系统为linux,默认的编码方式为utf-8,所以第一个文件的储存为正常的utf-8的编码成为的二进制形式,显示的时候,操作系统以utf-8的格式解码二进制码,所以第一个文件显示正常。
gbk1:python3编译器以utf-8方式编码成二进制码,在写入文件的时候,指定了gbk的格式,所以储存进文件是以gbk格式编码‘小甲’成为二进制文件,操作系统以utf-8的格式解码的时候出现的了错误
jis1:跟gbk1同理

用图来解释更清楚:
小甲------编编辑器储蓄:utf-8编码------->二进制码A--------编译器显示:utf-8解码------->小甲--------写入文件:gbk编码/shift-jis------>二进制码B/C--------utf-8解码---------->错误的乱码

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值