字符串
字符串本质是:字符序列,python的字符串是不可变的,我们无法对原字符串做任何修改,但可以将字符串的一部分复制到新创建的字符串,达到看起来修改的效果
python不支持单子符类型,单子符也是作为一个字符串使用的
字符串编码
python3直接支持Unicode,可以表示世界上任何书面语言的字符,默认是16位的Unicode编码,ASCII码是Unicodce编码的子集
使用内置函数ord()可以把字符串转换成对应的Unicode码
使用内置函数chr()可以把十进制数字转换成对应的字符
创建字符串
可以通过单引号或者双引号创建字符串 a = ‘abc’; b = “bcd”
使用两种引号的好处是可以创建本身就包含引导的字符串,而不适用转义字符
连续三个单引号或三个双引号,可以帮助我们创建多行字符串
空字符串和len()函数
python允许空字符串存在,不包含任何字符且长度为0
len()用于计算字符串包含有多少字符
转义字符
可以使用 \+特殊字符,实现某些难以用字符表示的效果
\ (在行尾时) 续行符
\ 反斜杠符号
’ 单引号
" 双引号
\b 退格
\n 换行
\t 横向制表符
\r 回车
字符串拼接
可以使用+将多个字符串拼接起来
- 如果+两边都是字符串,则拼接
- 如果+两边都是数字,则加法运算
- 如果+两边类型不同,则抛出异常
字符串复制
使用*实现字符串复制
从控制台读取字符串
可以使用input()从控制台接收键盘输入的内容
字符串str()
实现数字转型字符串,可以帮我们将其他数据类型转转换为字符串
当我们调用print()函数时,解释器自动调用了str()将非字符串的对象转换为字符串
使用[]提取字符
字符串的本质就是字符序列,可以通过在字符串后面加[],在里面指定偏移量,可以提取该位置的单个字符
正向搜索:
最左侧第一个字符,偏移量为0,第二个为1,以此类推,直到len(str)-1为止
反向搜索:
最右侧第一个字符,偏移量是-1,倒数第二个是-2,以此类推,直到-len(str)为止
replace()实现字符串替换
整个过程中,实际上我们是创建了新的字符串对象,并指向了变量a,而不是修改了以前的字符串
字符串切片slice操作
快速提取子字符串
格式:[起始偏移量 start: 终止偏移量 end : 步长 step]
字符串split()分割
可以基于指定分隔符将字符串分割成多个子字符串(存储到列表中),如果不指定分隔符,则默认使用空白字符
字符串join()合并
用于将一系列子字符串连接起来
拼接字符串要点:使用拼接字符串拼接符+,会生成新的字符串对象;不推荐使用
推荐使用join()函数,join()函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝仅新建一次对象
字符串驻留机制
仅保存一份相同不可变字符串的方法,不同的值被存放在字符串驻留池中,python支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线,字母,数字)会启用字符串驻留机制
字符串比较和同一性
字符串值比较: ==
字符串对象比较:is/not is
成员操作符
in/not in 关键字,判断某个字符(字符串)是否存在于字符串中
字符串常用查找方法
代码测试
去除首尾信息
通过strip()去除字符串首尾指定信息
通过lstrip()去除字符串左边指定信息
通过rstrip()去除字符串右边指定信息
大小写转换
格式排版
center() ljust() rjust用来实现字符串排版
其他方法
isalnum() 是否字母为字母或数字
isalpha() 检测字符串是否只由字母组成(含汉子)
isdigit() 检测字符串是否只由数字组成
isspace() 检测是否为空白符
isupper() 检测是否为大写字母
islower() 检测是否为小写字母
字符串格式化
format()基本用法
我们可以通过{索引}/{参数名},直接映射参数值,实现对字符串的格式化
填充与对齐
^,<,>,分别是居中,左对齐,右对齐,后面带宽度
:号后面带填充的字符,只能是一个字符,不指定默认是空格填充
数字格式化
浮点数通过f,整数通过d进行需要的格式化
可变字符串
在python中,字符串属于不可变对象不支持原地修改,如果需要修改只能创建新的字符串对象
但是有时候我们确实需要原地修改字符串,可以使用io.StringIO对象或array模块