python在WIN下CMD运行中文乱码及python 2.x python 3.x编码问题

以下为python 2.x版本

在CMD中运行python代码时,我们会发现,即使在代码中加入# -- coding:utf-8 -- 这段代码,中文仍然会乱码。如下:

# -*- coding:utf-8 -*-
content = "我是中文"
print content

因为CMD默认gbk编码,所以只能把代码中的中文进行gbk编码
utf-8通过解码转化为unicode,然后将unicode编码转化为gbk
代码:

# -*- coding:utf-8 -*-
content = "我是中文"
content_unicode = content.decode("utf-8")
content_gbk = content_unicode.encode("gbk")
print content_gbk

中文就显示成功了!

以下为python3.x版本

python3.x中在CMD中中文输出不会乱码。

# -*- coding:utf-8 -*-
content = "我是中文"
print(content)

总结:
python2.x和python3.x产生差别的原因:

主要是二者对于字符串的编码不同

python 2.x的字符串是有编码的,默认为ascii,但如果在其中写中文的话,解释器一般会报错,所以都在代码第一行或者第二行规定编码格式:

# -*- coding:utf-8 -*- 

想要转换为其他编码,就要进行先解码为unicode再编码的过程。
python 3.x的字符串类似python 2.x的unicode,是没有经过编码的,因此python 3.x的字符串没有decode属性,只有encode属性,调用这个方法后将产生bytes类型的字符串(有点像python 2.x中的字符串),而bytes类型支持解码操作。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值