python构建字典查大写英文字母ascii编码_Python2/3的中、英文字符编码与解码输出: UnicodeDecodeError: 'ascii' codec can't decode/enc...

本文探讨Python2和3中字符串的编码与解码,包括ASCII、Unicode、UTF-8等。在Python3中,通过decode和encode方法在bytes和str之间转换,而在Python2中,unicode和str序列需要对应方式进行编码解码。通过实例展示了如何处理中文字符,揭示了Python对中文支持的差异。
摘要由CSDN通过智能技术生成

Python中文虐我千百遍,我待Python如初恋。本文主要介绍在Python2/3交互模式下,通过对中文、英文的处理输出,理解Python的字符编码与解码问题(以点破面)。

前言:字符串的编码一开始是 ascii,只支持英文,由于多种语言的存在,出现万国码 unicode,但 unicode 不兼容 ascii,而且对存储空间造成浪费,所以出现 utf-8 编码,一种针对 unicode 的可变长度字符编码。

Python3的字符编码与解码输出

1 >>> hi = b'hello, world'

2 >>> hi

3 b'hello, world'

4 >>> print(hi)

5 b'hello, world'

6 >>> hi.decode('utf-8')

7 'hello, world'

1 >>> hey = '你好'

2 >>> hey

3 '你好'

4 >>> print(hey)

5 你好

6 >>> unihey = hey.encode('unicode_escape')

7 >>> unihey

8 b'\\u4f60\\u597d'

9 >>> print(unihey)

10 b'\\u4f60\\u597d'

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值