python3中的str和bytes

Python2的字符串有两种:str 和 unicode;Python3的字符串也有两种:str 和 bytes。
bytes可以是任何二进制数据,文本/图片/视频/音频等等。
str就是文本。

str与bytes互转

b = b"example"    # bytes object  
s = "example"     # str object  

s2b = bytes(s, encoding = "utf8")    # str to bytes 
s2b = str.encode(s)             # str to bytes 
s2b = s.encode("utf8")             # str to bytes 

b2s = str(b, encoding = "utf8")      # bytes to str  
b2s = bytes.decode(b)           #  bytes to str  
b2s = b.decode("utf8")           #  bytes to str  

略微详细的介绍

Python3 严格区分文本数据(str)和二进制数据(bytes)。文本数据可以变成二进制数据,但是二进制数据不一定是文本数据。比如图片,视频也可以用二进制数据(bytes)表示。

所以python3中bytes和str不能混用。因为bytes不一定能变成str,不同类型之间操作就会抛出TypeError的异常。

str和bytes的转换关系(注意bytes不一定能decode成str哦)
在这里插入图片描述

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:531509025
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
str.encode('encoding') -> bytes

bytes.decode('encoding') -> str

# encoding可以是 utf-8, gb2312, gbk等等

当bytes是图片,视频等非文本的二进制内容时,bytes就不能decode成str了。

In [29]: img = open('str-bytes.jpg', 'rb').read()

In [30]: type(img)
Out[30]: bytes

In [31]: img.decode('utf8')
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
<ipython-input-31-c9e28f45be95> in <module>()
----> 1 img.decode('utf8')

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值