python encode unicode_python decode encode unicode 中文乱码 的理解

查看系统编码

>>> import sys;print sys.getdefaultencoding()

ascii

>>> import sys;print sys.getdefaultencoding()

UTF-8

>>>repr('中文') == '\xe4\xb8\xad\xe6\x96\x87' #执行环境是utf8

>>>repr('中文') =='\xd6\xd0\xce\xc4' #执行环境是asicc

utf8下>>> '中文'.decode('UTF8')

asicc下>>>'中文'.decode('GBK')

结果都是:  u'\u4e2d\u6587'(unicode码)

在环境是asicc下看到中文必须是u'\u4e2d\u6587'.encode('GBK'或'gb2312' 或'gb18030')

如果 utf8下对unicode码使用gbk 看到是乱码

如果 asicc下对unicode码使用utf8 看到是乱码

使用print unicode的时候,会自动使用encode('系统编码进行')

可以看到

转成unicode

#执行环境是utf8

>>>b =  '中文'.decode('utf-8')

>>>c =  unicode ('中文', 'utf-8')

>>>d = u'中文'

>>>e = ''\xe4\xb8\xad\xe6\x96\x87''.decode(''utf-8)

#执行环境是asicc

>>>bb = '中文'.decode('GBK')

>>>cc = unicode ('中文', 'GBK')

>>>dd = '\xd6\xd0\xce\xc4'.decode('GBK')

结果都一样

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值