Python3以unicode编码字符串。
字符与unicode编码(十进制数)的转换函数
>>> ord('A')
65
>>> ord('中')
20013
>>> chr(66)
'B'
>>> chr(25991)
'文'
以Unicode表示的str
通过encode()
方法可以编码为指定的bytes
(以ascii码表示,超出其表示范围的会报错)
>>> 'ABC'.encode('ascii')
b'ABC'
>>> '中文'.encode('utf-8')
b'\xe4\xb8\xad\xe6\x96\x87'
反过来,如果我们从网络或磁盘上读取了字节流,那么读到的数据就是
bytes
。要把
bytes
变为
str
,就需要用
decode()
方法:
>>> b'ABC'.decode('ascii')
'ABC'
>>> b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
'中文'
len()函数用以计算字符串的字符数