pythonunicode和str_关于python2中的unicode和str以及python3中的str和bytes

最新推荐文章于 2020-12-06 05:29:47 发布

weixin_39860280

最新推荐文章于 2020-12-06 05:29:47 发布

阅读量50

点赞数

文章标签： pythonunicode和str

python3有两种表示字符序列的类型：bytes和str。前者的实例包含原始的8位值；后者的实例包含Unicode字符。

python2中也有两种表示字符序列的类型，分别叫做str和unicode。与python3不同的是，str的实例包含原始的8位值，而unicode的实例，则包含Unicode字符。

上面两句话我特别不懂，所以文章后面就下是希望为了把上面两句话弄懂。

看几个例子：

#在python2中

>>> type('x'.decode('utf-8')) #为啥不是二进制了，字符串还能解码？再怎么解

#在python3中

>>> type('x'.decode('utf-8')) #这才是正常的吗！

Traceback (most recent call last):

File"", line 1, in AttributeError:'str' object has no attribute 'decode' #字符串怎么解，本来就没有吗

首先这个就是Python语言本身的问题，因为在Python2的语法中，默认的str并不是真正意义上我们理解的字符串，而是一个byte数组，或者可以理解成一个纯ascii码字符组成的字符串，与python3中的bytes类型的变量对应，而真正意义上通用的字符串则是unicode类型的变量，它与Python3中的str变量对应本来应该用作byte数组的类型却用来做字符串，你说乱不乱，之所以这样做是为了与之前的程序保持兼容。

在Python2中，作为两种类型的字符序列，str与unicode需要转换，它们是这样转换的.

str——decode方法——》unicode——encode方法——》str

在python3中可以这样对应这转换，配合上面的图，也许会好理解一点。

byte——decode（解码）方法——》str——>encode（编码）方法——》byte

#在python2中

>>> type('x')

>>> type('x'.decode('utf-8'))

>>> type(u'x'.encode('utf-8'))

#在python3中

>>>type(x)

>>> type(b'x')>>> type(b'x'.decode('utf-8'))

>>> type('x'.encode('utf-8'))

还有就是隐式的转换，当一个unicode字符串和一个str字符串进行连接的时候，会自动将str字符串转换成unicode类型然后再连接，而这个时候使用的编码方式则是系统所默认的编码方式。python2默认的是ASCII，python3默认的是utf-8。

#在python2中

>>> x = u'喵'

>>>x

u'\u55b5'

>>>type(x)

#在python3中

>>> x = u'喵'

>>>x'喵'

>>>type(x)

#为啥结果不一样

weixin_39860280

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pythonunicode和str_关于python2中的unicode和str以及python3中的str和bytes

python3有两种表示字符序列的类型：bytes和str。前者的实例包含原始的8位值；后者的实例包含Unicode字符。python2中也有两种表示字符序列的类型，分别叫做str和unicode。与python3不同的是，str的实例包含原始的8位值，而unicode的实例，则包含Unicode字符。上面两句话我特别不懂，所以文章后面就下是希望为了把上面两句话弄懂。看几个例子：#在python2...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。