Python入门教程推荐书(点击下载)
在最新的Python 3版本中,字符串是以Unicode编码的,也就是说,Python的字符串支持多语言
Python提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符
由于Python的字符串类型是str,在内存中以Unicode表示,一个字符对应若干个字节。如果要在网络上传输,或者保存到磁盘上,就需要把str变为以字节为单位的bytes。
Python对bytes类型的数据用带b前缀的单引号或双引号表示:
x = b'ABC'
b'ABC'.decode('ascii')
'ABC'.encode('ascii')
要计算str包含多少个字符,可以用len()函数
为了让.py文件按UTF-8编码读取,我们通常在文件开头写上这两行:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
申明了UTF-8编码并不意味着你的.py文件就是UTF-8编码的,必须并且要确保文本编辑器正在使用UTF-8 without BOM编码
用记事本写的时候,保存没选UTF-8然后运行会报:SyntaxError: (unicode error) ‘utf-8’ codec can’t decode byte 0xc4 in position 2: invalid continuation byte
字符串格式化
在Python中,采用的格式化方式和C语言是一致的,用%实现,%运算符就是用来格式化字符串的。在字符串内部,%s表示用字符串替换,%d表示用整数替换,有几个%?占位符,后面就跟几个变量或者值,顺序要对应好。如果只有一个%?,括号可以省略。