编码
ASCII:一个字节一个字符,无汉字
Unicode:两个字节一个字符
UTF-8:英文字母一个字节,汉字三个字节
计算机内存:Unicode;硬盘或传输:UTF-8
字符串
ord()获取字符的整数表示;chr()转换编码为对应字符
>>> ord('A')
65
>>> ord('中')
20013
>>> chr(66)
'B'
>>> chr(25991)
'文'
以Unicode表示的str通过encode()编码为指定的bytes,无法显示为ASCII字符的字节用\x##表示
读取到字节流bytes通过decode()变为str,如果有一小部分无效的字节,传入errors='ignore'忽略
>>> 'ABC'.encode('ascii')
b'ABC'
>>> '中文'.encode('utf-8')
b'\xe4\xb8\xad\xe6\x96\x87'
>>> b'ABC'.decode('ascii')
'ABC'
>>> b'\xe4\xb8\xad'.decode('utf-8')
'中'
>>> b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore')
'中'
len()计算str字符数、bytes字节数
格式化
%d,%nd,%0nd | 整数,补n-1个空格,补n-1个0 |
%f,%.nf | 浮点数,保留n个小数位数 |
%s | 字符串 |
%x | 十六进制整数 |
%% | % |
>>> 'Hello, %s' % 'world'
'Hello, world'
>>> 'Hi, %s, you have $%d.' % ('Michael', 1000000)
'Hi, Michael, you have $1000000.'
format()将传入参数替换字符串内的占位符
>>> 'Hello, {0}, 成绩提升了 {1:.1f}%'.format('小明', 17.125)
'Hello, 小明, 成绩提升了 17.1%'
f-string是以f开头的字符串包含{x},以对应的变量替换
>>> r = 2.5
>>> s = 3.14 * r ** 2
>>> print(f'The area of a circle with radius {r} is {s:.2f}')
The area of a circle with radius 2.5 is 19.62
练习
小明的成绩从去年的72分提升到了今年的85分,请计算小明成绩提升的百分点,并用字符串格式化显示出'xx.x%'
,只保留小数点后1位:
s1 = 72
s2 = 85
r = (s2-s1)/s1*100
print('小明成绩提升了%.1f%%' % r)
print('小明成绩提升了{0:.1f}%'.format(r))
print(f'小明成绩提升了{r:.1f}%')