Python基础之字符串及编码
1.字符编码介绍
下图总结了字符编码的发展历史和ASCII,Unicode,utf-8三种字符编码的特性及工作方式,非常容易了解。
2.Python字符串介绍:
python3字符串编码格式:在内存中 是使用Unicode编码的,也就是能够支持多语言
>>> print('输出的是字符串str')
输出的是字符串str
在内存中的字符串类型数据存储到磁盘或者在网络传输就要转换为bytes类型的数据,x=b’ABC’是byte类型数据,y=‘ABC’是字符串类型数据,byte类型数据一个字符只占一个字节。
2.1 字符串相关函数
ord():将单个字符串转换为整数,
chr():将整数转换为单个字符
\u十六进制:用十六进制表示字符串(前提是知道字符串的整数编码)
encode():将unicode编码的字符串按照特定的编码方式编码成bytes(内存中的数据存储到硬盘的过程)
decode():将bytes数据转换为str(从网络或者硬盘读取字节流的过程)
len():计算字符串包含多少个字符,计算bytes包含多少个字节
测试代码:
>>> ord('A')
65
>>> ord('姚')
23002
>>> chr(65)
'A'
>>> chr(23002)
'姚'
>>> '\u59da\u6f47\u950b'
'姚潇锋'
>>> 'ABC'.encode('ASCII')
b'ABC'
>>> '姚潇锋'