字符串基本特点
1. 字符串的本质是:字符序列。
2. Python不支持单字符类型,单字符也是作为一个字符串使用的。
> ⚠️Python的字符串是不可变的,我们无法对原字符串做任何修改。但,可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。
> 很多人初学编程时,总是担心自己数学不行,潜意识里认为数学好才能编程。实际上,大多数程序员打交道最多的是“字符串”而不是“数学”。因为,编程是用来解决现实问题的,因此逻辑思维的重要性远远超过数学能力。
字符串的编码
Python3直接支持Unicode,可以表示世界上任何书面语言的字符。Python3的字符默认就是16位Unicode编码,ASCII码是Unicode编码的子集。
![image-20211026162907356](https://www.itbaizhan.com/wiki/imgs/image-20211026162907356.png)Python3直接支持Unicode,可以表示世界上任何书面语言的字符。Python3的字符默认就是16位Unicode编码,ASCII码是Unicode编码的子集。
使用内置函数ord()可以把字符转换成对应的Unicode码;
使用内置函数chr()可以把十进制数字转换成对应的字符。
引号创建字符串
我们可以通过单引号或双引号创建字符串。例如:`a='abc'` `b="why"`
使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。例如:
a = "I'm a teacher!"
print(a) # i'm a teacher!
b = 'my_name is "TOM"'
print(b) # my_name is "TOM"
连续三个单引号或三个双引号,可以帮助我们创建多行字符串。在长字符串中会保留原始的格式。例如:
s='''
I
Love
Python
'''
print(s)
空字符串和len()函数
Python允许空字符串的存在,不包含任何字符且长度为0。例如:
c = ''
print(len(c)) #结果:0
len()用于计算字符串含有多少字符。例如:
d = 'abcwhy'
len(d) #结果:6
字符串拼接
-
可以使用
+
将多个字符串拼接起来。例如:’aa’+ ’bb’
结果是’aabb’
- 如果
+
两边都是字符串,则拼接。 - 如果
+
两边都是数字,则加法运算 - 如果
+
两边类型不同,则抛出异常
- 如果
-
可以将多个字面字符串直接放到一起实现拼接。例如:
’aa’’bb’
结果是’aabb’
(方便大家看我把结果附上,想要验证的小伙伴可以用print()函数打印看看)
字符串复制
使用*(python中的乘法运算)可以实现字符串复制
常用方法汇总
1.大小写转换
2.查找方法
3.去除首尾信息
4.格式排版
5.特征判断方法
修改字符串的大小写
.title()首字母大写(示例)
在name.title()中,name后面的句点(.)让python对变量name执行方法title()指定的操作,在title()的括号中不需要额外的信息
以上就是今天所有代码的基本格式(创建字符串、打印字符串),后面不一一示范,大家可以自己敲一敲,熟悉熟悉
大小写转换
name = "whY yushU"
name.capitalize() | 首字母大写 | WhY yushU |
---|---|---|
name.title() | 每个单词的首字母大写 | WhY YushU |
name.upper() | 全部大写 | WHY YUSHU |
name.lower() | 全部小写 | why yushu |
name.swapcase() | 所有字母大小写转换 | WHy YUSHu |
查找方法
a='''我是欲赎,我是一名在校大学生,已经通过了9年义务教育,我目前是一个python语言的普及者,希望通过教导别人提高自己,促进大家一起进步'''
len(a) | 字符串长度 | 67 |
a.startswith("我是欲赎") | 以指定字符串开头 | True |
a.endswith("进步") | 以指定字符串结尾 | True |
a.find("已") | 第一次出现指定字符串的位置 | 15 |
a.count("是") | 指定字符串出现了几次 | 3 |
a.rfind("进步") | 最后一次出现指定字符串的位置 | 65 |
a.isalnum() | 所有字符全是字母或数字 | False |
注意:在编程语言的顺序中,0都是不可忽略的,在所有操作中,第一项是第0项
去除首尾信息
我们可以通过strip()去除字符串首尾指定信息。通过lstrip()去除字符串左边指定信息,rstrip()去除字符串右边指定信息。
a = "*why*"
a.strip("*") | 去除首位指定信息 | why |
a.lstrip("*") | 去除左边指定信息 | why* |
a.rstrip("*") | 去除右边指定信息 | *why |
格式排版
a = "why"
center(),ljust(),rjust(),定义字符串空间大小
a.center(10,"*") | 占据10个字节,居中,两边补充* | ***why**** |
a.ljust(10,"*") | 占据10个字节,左对齐,右边补充* | why******* |
a.rjust(10, "*") | 占据10个字节,右对齐,做边补充* | *******why |
当然也可以不填充任何字符,即填充空字符
比如:a.center(10)
结果为:' why '
特征判断方法
. isalnum() | 是否为字母或数字 |
. isalpha() | 检测字符串是否只由字母组成(含汉字) |
.isdigit() | 检测字符串是否只由数字组成 |
.isspace() | 检测是否为空白符 |
. isupper() | 是否为大写字母 |
.islower() | 是否为小写字母 |
replace()`实现字符串替换
字符串是“不可改变”的,我们通过[]可以获取字符串指定位置的字符,但是我们不能改变字符串。字符串不可改变。但是,我们确实有时候需要替换某些字符。这时,只能通过创建新的字符串来实现。
>>> a = 'abcdefghijklmnopqrstuvwxyz'
>>> a = a.replace('c','欲')
'ab欲defghijklmnopqrstuvwxyz'
整个过程中,实际上我们是创建了新的字符串对象,并指向了变量a,而不是修改了以前的字符串。
str()实现数字转型字符串
str()可以帮助我们将其他数据类型转换为字符串。例如:
a = str(5.20) #结果是:a = ‘5.20’
b = str(3.14e2) #结果是:b = ’314.0’
c = str(True) #结果是:c = ‘True’
> 当我们调用print()函数时,解释器自动调用了str()将非字符串的对象转成了字符串。
使用[]提取字符
字符串的本质就是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量,可以提取该位置的单个字符。
1. 正向搜索:
最左侧第一个字符,偏移量是0,第二个偏移量是1,以此类推。直到len(str)-1为止。
2. 反向搜索:
最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2,以此类推,直到-len(str)为止。
字符串切片slice操作
切片slice操作可以让我们快速的提取子字符串。标准格式为:
[起始偏移量start:终止偏移量end:步长step]
典型操作(三个量为正数的情况)如下:
操作和说明 | 示例 | 结果 |
---|---|---|
[:] 提取整个字符串 | “abcdef”[:] | “abcdef” |
[start:] 从start索引开始到结尾 | “abcdef”[2:] | “cdef” |
[:end] 从头开始知道end-1 | “abcdef”[:2] | “ab” |
[start:end] 从start到end-1 | “abcdef”[2:4] | “cd” |
[start:end:step] 从start提取到end-1,步长是step | “abcdef”[1:5:2] | “bd” |
其他操作(三个量为负数)的情况:
示例 | 说明 | 结果 |
---|---|---|
"abcdefghijklmnopqrstuvwxyz"[-3:] | 倒数三个 | “xyz” |
"abcdefghijklmnopqrstuvwxyz"[-8:-3] | 倒数第八个到倒数第三个(包头不包尾) | 'stuvw' |
"abcdefghijklmnopqrstuvwxyz"[::-1] | 步长为负,从右到左反向提取 | 'zyxwvutsrqponmlkjihgfedcba' |
切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始偏移量小于0则会当做0,终止偏移量大于“长度-1”会被当成-1。例如:
>>> "abcdefg"[3:50]
'defg'
我们发现正常输出了结果,没有报错。
split()分割和join()合并
split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔符,则默认使用空白字符(换行符/空格/制表符)。示例代码如下:
>>> a = "to be or not to be"
>>> a.split()
['to', 'be', 'or', 'not', 'to', 'be']
>>> a.split('be')
['to ', ' or not to ', '']
join()的作用和split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下:
>>> a = ['why,'why100','why200']
>>> '*'.join(a)
'why*why100*why200'
拼接字符串要点: 使用字符串拼接符
+
,会生成新的字符串对象,因此不推荐使用+
来拼接字符串。推荐使用join
函数,因为join
函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝,仅新建一次对象。
字符串驻留机制和字符串比较
字符串驻留:常量字符串只保留一份。
c = "dd#"
d = "dd#"
print(c is d) #True
字符串比较和同一性
我们可以直接使用==
!=
对字符串进行比较,是否含有相同的字符。
我们使用is
not is
,判断两个对象是否同一个对象。比较的是对象的地址,即id(obj1)
是否和id(obj2)
相等。
成员操作符判断子字符串
in
not in
关键字,判断某个字符(子字符串)是否存在于字符串中。
"ab" in "abcdefg"
#true
字符串的格式化
format()
基本用法
基本语法是通过 {}
和:
来代替以前的 %
。
format()
函数可以接受不限个数的参数,位置可以不按顺序。
我们可以通过{索引}/{参数名},直接映射参数值,实现对字符串的格式化,非常方便。
可变字符串
- Python中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,只能创建新的字符串对象。
- 确实需要原地修改字符串,可以使用io.StringIO对象或array模块