字符串的本质是:字符序列。Python的字符串是不可变的,我们无法对原字符串做任何修改。但,可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。
Python不支持单字符类型,单字符也是作为一个字符串使用的。
目录
一、字符串的编码
Python3直接支持Unicode,可以表示世界上任何书面语言的字符。Python3的字符默认就是16位Unicode编码,ASCII码是Unicode编码的子集。
使用内置函数ord可以把字符转换成对应的Unicode码
使用内置函数chr可以把十进制数字转换成对应的字符
print(ord('a')) #结果为97
print(chr(97)) #结果为a
二、引号创建字符串和len()函数
我们可以通过单引号或双引号创建字符串,好处在于可以创建本身就包含引号的字符串,而不用使用转义字符。
连续三个单引号或三个双引号,可以帮助我们创建多行字符串,字符串行尾会自动加上回车换行,如果不需要回车换行,在行尾添加 \
即可。
a='''I
love
you
'''
print(a)
'''
结果为:
I
love
you
'''
Python允许空字符串的存在。
a=''
print(len(a))
#结果为0
len()函数用于计算字符串含有多少字符。
三、转义字符
我们可以使用“\+特殊字符”,实现某些难以用字符表示的效果。
\(在行尾时) | 续行符 |
---|---|
\\ | 反斜杠符号 |
\' | 单引号 |
\" | 双引号 |
\b | 退格 |
\n | 换行 |
\t | 横向制表符 |
\r | 回车 |
四、字符串的拼接
字符串可以用 +
合并(粘到一起),也可以用 *
重复。
相邻的两个或多个 字符串字面值 (引号标注的字符)会自动合并。
五、str()函数
将其他类型的数据转换成字符串
六、使用[]提取字符
字符串的本质就是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量,可以提取该位置的单个字符。
正向搜索∶
最左侧第一个字符,偏移量是0,第二个偏移量是1,以此类推。直到 len(str)-1为止。
反向搜索:
最右侧第一个字符,偏移量是-1 ,倒数第二个偏移量是-2,以此类推,直到-len(str)为止。
七、replace()函数
创建新的字符串变量并指向原字符串,而不是修改原字符串变量。
a='666666'
print(a.replace('6','7'))
#结果为777777
八、切片slice操作
s[start:end:step]
切片从start开始,到end-1结束。
step省略时默认为1,start省略时默认为0,end省略时默认为len(s)。
当start和end不在范围内的时候默认为0和len(s)。
(输出结果包含切片开始,但不包含切片结束。因此,str[:i] + str[i:]
总是等于 s
)
九、split()和join()
split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔符,则默认使用空白字符(换行符/空格/制表符)。
join()用于字符串的拼接。
a=['I','love','you']
print(' '.join(a))
#结果为I love you
十、字符串驻留机制
仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。Python支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母和数字)会启用字符串驻留机制驻留机制。
十一、成员操作符
可以用in或not in关键字判断某个子字符串是否在字符串中
十二、字符串常用方法
①常用查找方法
len(a) #指定字符串的长度
a.startswith() #是否以指定字符串开头
a.endswith() #是否以指定字符串结尾
a.find() #第一次出现指定字符串的位置
a.rfind() #最后一次出现指定字符串的位置
a.count() #指定字符串出现的次数
a.isalnum() #指定字符串是否全为数字或字母
②去除首尾信息
我们可以通过strip()去除字符串首尾指定信息。通过Istrip()去除字符串左边指定信息,rstrip()去除字符串右边指定信息。
③大小写转换
a.capitalize() #产生首字母大写的新字符串
a.title() #产生每个单词首字母大写的新字符串
a.upper() #产生每个字母都大写的新字符串
a.lower() #产生每个字母都小写的新字符串
a.swapcase() #产生所有字母大小写转换的新字符串
④格式排版
可以用center()、ljust()、rjust()这三个函数用于对字符串实现排版。
a="I love you"
print(a.center(15,'_'))
#结果为:___I love you__
a="I love you"
print(a.ljust(15,'_'))
#结果为:I love you_____
a="I love you"
print(a.rjust(15,'_'))
#结果为:_____I love you
⑤其他方法
a.isalnum() #是否全为字母或数字
a.isalpha() #检测字符串是否只由字母组成(含汉字)
a.isdigit() #桧测字符串是否只由数字组成
a.isspace() #检测是否全为空白符
a.isupper() #是否全为大写字母
a.islower() #是否全为小写字母
十三、format格式化
通过{}来代替原先的%格式化操作,format函数可以接收不限个参数,参数位置不一定要按顺序来。
#序号索引匹配一定要按顺序匹配
a="{0} {1} {2}"
print(a.format("I","love","you"))
'''
#参数名匹配可以不按顺序匹配且一定要用参数名=的形式
a="{q} {w} {e}"
print(a.format(q="I",w="love",e="you"))
'''
#结果为:I love you
填充常跟对齐一起使用
^、<、>分别是居中、左对齐、右对齐,后面带宽度
:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充
a="{0:_^10} {1:_^10} {2:_^10}"
print(a.format("I","love","you"))
#结果为:____I_____ ___love___ ___you____
数字 | 格式 | 输出 | 描述 |
---|---|---|---|
7.7777777 | {:.2f} | 7.78 | 保留小数点后两位 |
7.7777777 | {:+.2f} | +7.78 | 带符号保留小数点后两位 |
7.7777777 | {:.0f} | 8 | 不带小数 |
7 | {:0>2d} | 07 | 数字补0(填充左边,宽度为2) |
7 | {:x<4d} | 7xxx | 数字补x(填右左边,宽度为4) |
77 | {:x<4d} | 77xx | 数字补x(填右左边,宽度为4) |
7777777 | {:,} | 7,777,777 | 以逗号分隔的数字格式 |
0.77 | {:.2%} | 77.00% | 百分比格式 |
7777777 | {:.2e} | 7.78e+06 | 科学计数法 |
77 | {:10d} | 77 | 右对齐(宽度为10) |
77 | {:<10d} | 77 | 左对齐(宽度为10) |
77 | {:^10d} | 77 | 居中对齐(宽度为10) |
十四、可变字符串
在Python中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值需要智能创建新的字符串对象。但是,经常我们确实需要原地修改字符串,可以使用io.StringIO对象或array模块。
import io
a=io.StringIO('7777')
print(a)
print(a.getvalue())
a.seek(0) #移动到位置0处
a.write('6') #从此处开始覆盖6
print(a.getvalue())
'''
结果为:
<_io.StringIO object at 0x000001A916C0F040>
7777
6777
'''