一、python3对文本和二进制数据做了区分。文本是Unicode编码,str类型,用于显示。二进制类型是bytes类型,用于存储和传输。bytes是byte的序列,而str是unicode的序列。
str类型:
1 >>> s = u'你好'
2 >>>s3 '你好'
4 >>>type(s)5
bytes类型:
1 >>> b = b'abc'
2 >>>b3 b'abc'
4 >>>type(b)5
二、str和bytes之间的转换关系:str-->encode()-->bytes-->decode()-->str
转换方式一:encode(),decode()
1 >>> a = u'你好'
2 >>> b = a.encode('utf-8')3 >>>b4 b'\xe4\xbd\xa0\xe5\xa5\xbd'
5 >>>type(b)6
7 >>> new_a = b.decode('utf-8')8 >>>new_a9 '你好'
10 >>>type(new_a)11
转换方式二:bytes(),str()
1 >>> a = u'你好'
2 >>> b= bytes(a, encoding='utf-8')3 >>>b4 b'\xe4\xbd\xa0\xe5\xa5\xbd'
5 >>>type(b)6
7 >>> new_a = str(b, encoding='utf-8')8 >>>new_a9 '你好'
10 >>>type(new_a)11
三、bytearray类型
bytearray类是range 0 < = x < 256的一个可变序列。
可选的源参数可以用几种不同的方式来初始化数组:
如果它是一个字符串,那么您还必须给出编码(以及可选的错误)参数;bytearray()然后使用str.encode()将字符串转换为字节。
如果它是一个整数,那么数组将具有这个大小,并将用null字节初始化。
如果它是符合缓冲区接口的对象,则将使用对象的只读缓冲区来初始化字节数组。
如果它是可迭代的,那么它必须是range 0 < = x < 256的整数的迭代,它被用作数组的初始内容
如果没有参数,则创建一个大小为0的数组。
当源参数是一个字符串时:
1 >>> b = bytearray(u'你好', encoding='utf-8')2 >>>b3 bytearray(b'\xe4\xbd\xa0\xe5\xa5\xbd')4 >>>type(b)5
当源参数是一个整数时:
1 >>> b = bytearray(5)2 >>>b3 bytearray(b'\x00\x00\x00\x00\x00')4 >>>type(b)5
当源参数是一个可迭代对象,那么这个迭代对象的元素都必须符合0 <= x < 256:
1 >>> b = bytearray([1, 2, 3, 4, 255])2 >>>b3 bytearray(b'\x01\x02\x03\x04\xff')4 >>>type(b)5
四、bytes和bytearray区别
bytes是不可变的,同str。bytearray是可变的,同list。
1 >>> b =bytearray()2 >>>b3 bytearray(b'')4 >>> b.append(10)5 >>>b6 bytearray(b'\n')7 >>> b.append(100)8 >>>b9 bytearray(b'\nd')10 >>> b.remove(100)11 >>>b12 bytearray(b'\n')13 >>> b.insert(0, 150)14 >>>b15 bytearray(b'\x96\n')16 >>> b.extend([1, 3, 5])17 >>>b18 bytearray(b'\x96\n\x01\x03\x05')19 >>> b.pop(2)20 1
21 >>>b22 bytearray(b'\x96\n\x03\x05')23 >>>b.reverse()24 >>>b25 bytearray(b'\x05\x03\n\x96')26 >>>b.clear()27 >>>b28 bytearray(b'')
五、bytes和 bytearray转换
1 >>> b = b'abcdef'
2 >>> bay =bytearray(b)3 >>>bay4 bytearray(b'abcdef')5 >>> b =bytes(bay)6 >>>b7 b'abcdef'
六、bytearray和str转换
1 >>> a = 'abcdef'
2 >>> b = bytearray(a, encoding='utf-8')3 >>>b4 bytearray(b'abcdef')5 >>> a = b.decode(encoding='utf-8')6 >>>a7 'abcdef'