Python小技巧:bytes与str的区别,Python并发原理解析

也不能将bytes实例添加到str实例:

‘one’ + b’two’

Traceback …

TypeError: can only concatenate str (not “bytes”) to str

bytes与bytes之间可以用二元操作符(binary operator)来比较大小,str与str之间也可以:

assert b’red’ > b’blue’

assert ‘red’ > ‘blue’

但是str实例不能与bytes实例比较:

assert ‘red’ > b’blue’

反过来也一样,也就是说bytes实例不能与str实例比较:

assert b’blue’ < ‘red’

判断bytes与str实例是否相等,总是会评估为假(False),即便这两个实例表示的字符完全相同,它们也不相等。例如,在下面这个例子里,它们表示的字符串都相当于ASCII编码之中的foo。

print(b’foo’ == ‘foo’)

False

两种类型的实例都可以出现在%操作符的右侧,用来替换左侧那个格式字符串(format string)里面的%s。

‘’’

遇到问题没人解答?小编创建了一个Python学习交流QQ群:778463939

寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!

‘’’

print(b’red %s’ % b’blue’)

print(‘red %s’ % ‘blue’)

b’red blue’

red blue

如果格式字符串是bytes类型,那么不能用str实例来替换其中的%s,因为Python不知道这个str应该按照什么方案来编码。

print(b’red %s’ % ‘blue’)

但反过来却可以,也就是说如果格式字符串是str类型,则可以用bytes实例来替换其中的%s,问题是,这可能跟你想要的结果不一样。

print(‘red %s’ % b’blue’)

red b’blue’

这样做,会让系统在bytes实例上面调用__repr__方法,然后用这次调用所得到的结果替换格式字符串里的%s,因此程序会直接输出b’blue’,而不是像你想的那样,输出blue本身。

第二个问题发生在操作文件句柄的时候,这里的句柄指由内置的open函数返回的句柄。这样的句柄默认需要使用Unicode字符串操作,而不能采用原始的bytes。习惯了Python 2的开发者,尤其容易碰到这个问题,进而导致程序出现奇怪的错误。例如,向文件写入二进制数据的时候,下面这种写法其实是错误的。

with open(‘data.bin’, ‘w’) as f:

f.write(b’\xf1\xf2\xf3\xf4\xf5’)

Traceback …

TypeError: write() argument must be str, not bytes

程序发生异常是因为在调用open函数时,指定的是’w’模式,所以系统要求必须以文本模式写入。如果想用二进制模式,那应该指定’wb’才对。在文本模式下,write方法接受的是包含Unicode数据的str实例,不是包含二进制数据的bytes实例。所以,我们得把模式改成’wb’来解决该问题。

with open(‘data.bin’, ‘wb’) as f:

f.write(b’\xf1\xf2\xf3\xf4\xf5’)

读取文件的时候也有类似的问题。例如,如果要把刚才写入的二进制文件读出来,那么不能用下面这种写法。

with open(‘data.bin’, ‘r’) as f:

data = f.read()

程序出错,是因为在调用open函数时指定的是’r’模式,所以系统要求必须以文本模式来读取。若要用二进制格式读取,应该指定’rb’。以文本模式操纵句柄时,系统会采用默认的文本编码方案处理二进制数据。

所以,上面那种写法会让系统通过bytes.decode把这份数据解码成str字符串,再用str.encode把字符串编码成二进制值。然而对于大多数系统来说,默认的文本编码方案是UTF-8,所以系统很可能会把b’\xf1\xf2\xf3\xf4\xf5’当成UTF-8格式的字符串去解码,于是就会出现上面那样的错误。为了修正错误,需要把模式改成’rb’。

‘’’

遇到问题没人解答?小编创建了一个Python学习交流QQ群:778463939

寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!

‘’’

with open(‘data.bin’, ‘rb’) as f:

data = f.read()

assert data == b’\xf1\xf2\xf3\xf4\xf5’

另一种改法是在调用open函数的时候,通过encoding参数明确指定编码标准,以确保平台特有的一些行为不会干扰代码的运行效果。例如,假设刚才写到文件里的那些二进制数据表示的是一个采用’cp1252’标准(cp1252是一种老式的Windows编码方案)来编码的字符串,则可以这样写:

现在能在网上找到很多很多的学习资源,有免费的也有收费的,当我拿到1套比较全的学习资源之前,我并没着急去看第1节,我而是去审视这套资源是否值得学习,有时候也会去问一些学长的意见,如果可以之后,我会对这套学习资源做1个学习计划,我的学习计划主要包括规划图和学习进度表。

分享给大家这份我薅到的免费视频资料,质量还不错,大家可以跟着学习

小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数初中级Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Python爬虫全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)
img

果低效又漫长,而且极易碰到天花板技术停滞不前!**

因此收集整理了一份《2024年Python爬虫全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)
[外链图片转存中…(img-sAoodPHk-1710978653290)]

  • 17
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值