简单理解Python中bytes和str区别

学习Python之后,会知道Python中存在两种数据类型,一种是bytes,一种是str。二者都可以用来存储字符串,虽然传统意义上str才是字符串,而bytes则是字节流。但是当二者进行存储时(不论是内存还是写出到文件)实际上都是使用二进制进行存储。那么二者在用于存储字符串时,有什么区别呢?

《浅析Python中bytes和str区别》文章中提到“使用bytes类型,实质上是告诉Python,不需要它帮你自动地完成编码和解码的工作,而是用户自己手动进行,并指定编码格式。

这句话是十分关键的,其意义是在使用str类型时,实际上解码编码都是使用Python默认的Unicode进行编码。而当我们从网络或者本地文件获得到一些文件时,由于编码方式并不一定是Unicode,则此时需要程序员来决定使用什么编码方式进行解码(或者编码这些数据)。此时,bytes则派上用场了,该类型可以允许我们使用自己选择的编码方式进行解码。

例如:某文本文件是GB2312编码,那么如果直接读入的话,显然是会出错的,因为Python默认使用Unicode进行解码。我们需要以bytes的数据类型存储该文件,并给定编码方式(此时是GB2312)进行解码,而后Python才能够使用Unicode进行正常显示。

说一句无关主题的话,如果我们没有业务需求,写出字符串最好还是不要用奇奇怪怪的编码方式,采用UTF-8编码是最佳的。

// 全文完

因笔者能力有限,若文章内容存在错误或不恰当之处,欢迎留言、私信批评指正。
Email:YePeanut[at]foxmail.com

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值