py---关于编码解码（解决乱码问题）

最新推荐文章于 2023-02-16 13:31:25 发布

阿AXE

最新推荐文章于 2023-02-16 13:31:25 发布

阅读量409

点赞数

分类专栏：全栈

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44834239/article/details/105930736

版权

全栈专栏收录该内容

14 篇文章 0 订阅

订阅专栏

如果你在某些情况，如cmd上运行程序，那么很有可能会遇到乱码问题，那么解决方法就是编码解码方面的问题了，寻找到对应的编码库，然后在编码库下进行编码解码，会让你的程序从此摆脱乱码问题
windows系统cmd默认是JBK，可以通过chcp 936，将cmd的编码库改成utf8，这样运行.py文件，打印就不会出现乱码问题了

python3.x默认unicode编码，unicode向下兼容gb2312，gbk等

计算机编码的发展

二进制---->ASCII---->unicode（各国有各国的编码库，但是全球统一unicode，万国码）
utf-8是unicode的一个扩展,一个英文用Ascii存，占1个字节，一个中文占3个字节
然后就是各国的编码库，比如中国的gbk，日本的jpk，韩国的ksb，如果中国用日本的软件，需要先将日本软件的字符进行编码解码操作，转换成unicode，再转换成gbk。

python3中字符默认编码是unicode，文件默认编码是utf-8，要转换成gbk，直接encode(‘gbk’)操作，注意在编码的同时，将数据转换成了bytes类型。即字节类型，[0~255],不同计算机间数据传输必须用bytes类型。

python3中只有str与bytes两种类型
str：unicode
bytes：十六进制
str----->bytes：编码，两种方法一样

      (1)b=bytes(s,'utf8')
      (2)b=s.encode('utf8')

bytes------>str：解码，两种方法一样

      (1)s=str(b,'utf8')
      (2)s=b.decode('utf8')

注意，编码解码来回必须在同一规则下进行，否则会乱码，因为不同编码库针对bytes类型有不同的翻译方法，

如’utf8’规则中中文三个字节代表一个汉字、而’gbk’规则两个字节代表一个汉字，
如果你好这两个字，编码用utf8，解码用gbk，那么会出现三个不认识的字（乱码）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
py---关于编码解码（解决乱码问题）

python3.x默认unicode编码，unicode向下兼容gb2312，gbk等计算机编码的发展二进制---->ASCII---->unicode（各国有各国的编码库，但是全球统一unicode，万国码）utf-8是unicode的一个扩展,一个英文用Ascii存，占1个字节，一个中文占3个字节然后就是各国的编码库，比如中国的gbk，日本的jpk，韩国的ksb，如果中国用...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。