python解码和编码_python之编码和解码

最新推荐文章于 2020-11-29 21:17:41 发布

weixin_39628342

最新推荐文章于 2020-11-29 21:17:41 发布

阅读量106

点赞数

文章标签： python解码和编码

编码:

1. ascii. 有: 数字, 字母, 特殊字符. 8bit 1byte 128 最前面是0

2. gbk. 包含: ascii, 中文(主要), 日文, 韩文, 繁体文字. 16bit, 2byte.

3. unicode. 包含gbk,ascii,big5... 32bit, 4byte

4. utf-8. 可变长度的unicode.

1. 英文: 8bit,1byte

2. 欧洲文字: 16bit 2byte

3. 中文: 24bit 3byte

不同的编码之间不能随意转换.

在python3中. 默认的编码是unicode,我们的字符串就是unicode

在python2中. 默认的编码是ASCII. 用的解释器是Cpython.c语言的默认编码是ASCII

unicode弊端:在存储和传输的时候. 是很浪费的

在存储和传输的时候不能直接使用unicode. 必须要对字符串进行编码. 编码成bytes类型(字节形式的字符串)

1.encode(编码格式) : 编码

bs1 = '我今天非常的困'

print(bs1.encode('gbk')) #b'\xce\xd2\xbd\xf1\xcc\xec\xb7\xc7\xb3\xa3\xb5\xc4\xc0\xa7'

2.decode(编码格式) : 解码

bs2 = b'\xce\xd2\xbd\xf1\xcc\xec\xb7\xc7\xb3\xa3\xb5\xc4\xc0\xa7'

print(bs2.decode('gbk'))#我今天非常的困

注意: 用gbk编码,必须用gbk解码; 用uft-8编码,必须用utf-8解码.

关于bytes, 非ascii中的内容. 展示的时候都是\x.. 如果是ascii中的内容. 原样输出

name = "alex昨天吃多了"bs= name.encode("gbk")print(bs)#b'alex\xd7\xf2\xcc\xec\xb3\xd4\xb6\xe0\xc1\xcb'

bss= name.encode("utf-8")print(bss) #b'alex\xe6\x98\xa8\xe5\xa4\xa9\xe5\x90\x83\xe5\xa4\x9a\xe4\xba\x86'

weixin_39628342

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python解码和编码_python之编码和解码

编码:1. ascii. 有: 数字, 字母, 特殊字符. 8bit 1byte 128 最前面是02. gbk. 包含: ascii, 中文(主要), 日文, 韩文, 繁体文字. 16bit, 2byte.3. unicode. 包含gbk,ascii,big5... 32bit, 4byte4. utf-8. 可变长度的unicode.1. 英文: 8bit,1byte2. 欧洲文字: 16b...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。