python在WIN下CMD运行中文乱码及python 2.x python 3.x编码问题

最新推荐文章于 2020-07-28 09:52:13 发布

皇冠carryman

最新推荐文章于 2020-07-28 09:52:13 发布

阅读量872

点赞数

分类专栏： python 文章标签： python 中文乱码 cmd

本文链接：https://blog.csdn.net/weixin_39415084/article/details/78247052

版权

python 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

以下为python 2.x版本

在CMD中运行python代码时，我们会发现，即使在代码中加入# -- coding:utf-8 -- 这段代码，中文仍然会乱码。如下：

# -*- coding:utf-8 -*-
content = "我是中文"
print content

因为CMD默认gbk编码，所以只能把代码中的中文进行gbk编码
utf-8通过解码转化为unicode，然后将unicode编码转化为gbk
代码：

# -*- coding:utf-8 -*-
content = "我是中文"
content_unicode = content.decode("utf-8")
content_gbk = content_unicode.encode("gbk")
print content_gbk

中文就显示成功了！

以下为python3.x版本

python3.x中在CMD中中文输出不会乱码。

# -*- coding:utf-8 -*-
content = "我是中文"
print(content)

总结：
python2.x和python3.x产生差别的原因：

主要是二者对于字符串的编码不同

python 2.x的字符串是有编码的，默认为ascii，但如果在其中写中文的话，解释器一般会报错，所以都在代码第一行或者第二行规定编码格式：

# -*- coding:utf-8 -*-

想要转换为其他编码，就要进行先解码为unicode再编码的过程。
python 3.x的字符串类似python 2.x的unicode，是没有经过编码的，因此python 3.x的字符串没有decode属性，只有encode属性，调用这个方法后将产生bytes类型的字符串（有点像python 2.x中的字符串），而bytes类型支持解码操作。

皇冠carryman

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python在WIN下CMD运行中文乱码及python 2.x python 3.x编码问题

以下为python 2.x版本在CMD中运行python代码时，我们会发现，即使在代码中加入# -- coding:utf-8 -- 这段代码，中文仍然会乱码。如下：# -*- coding:utf-8 -*-content = "我是中文"print content因为CMD默认gbk编码，所以只能把代码中的中文进行gbk编码 utf-8通过解码转化为unicode，然后将unicode编码
复制链接

扫一扫