![a100076f6263fed71b1488af177c3331.png](https://i-blog.csdnimg.cn/blog_migrate/9d3bd59fe20005d3197ca426e12ba0b9.jpeg)
序列
索引
序列是一块用于放置多个值得连续存储空间,并且按特定顺序排列,每个值(称为元素)都分配一个整数(由左至右则从 0 开始;由右至左则从 -1 开始),称为索引(index)或位置,如下所示:
![3e01f6b4078d470ae4452c01215dc94b.png](https://i-blog.csdnimg.cn/blog_migrate/26492dd91215d5d3b5cb1458d8ac592a.jpeg)
可以根据索引获取每个元素实际的值
string = "飞流直下三千尺,疑是银河落九天。"print(string[5])
则上面的语句的运行结果为“千”。
切片
切片是访问序列中元素的另一种方法,该方法可以访问一定范围内的元素。
sequence[startIndex : endIndex : step]
如果 startIndex 未指定,则默认从 0 开始;如果 endIndex 未指定,则默认一直到最后才结束切片;如果 step 未指定,则默认为 1,且其前面的冒号可以省略。
序列相加
在 Python 中支持将多个相同类型的序列相加(或者说拼接更准确),该操作只是单纯的将序列拼接在一起,而不进行其他附加的任何运算。
seq_1 = "飞流直下三千尺,"seq_2 = "疑是银河落九天。"print(seq_1 + seq_2)
当然,拼接之后实际上就是得到了一个新的序列,其索引将会重新排序。
序列相乘
数学意义上的乘法就是将一个数重复相加若干次之后得到一个结果,序列的乘法同样如此,也是将一个序列重复拼接若干次之后得到一个新的序列。
sequence = "Hello, Python !"print(sequence * 3)
in
in 关键字用于检查某个元素是否在被检测的序列中,
element in sequence
在 in 的前面加上 not 关键字,则表示检查某个元素是否不在被检测的序列中,
element not in sequence
如果满足以上两种操作,则返回 True,否则返回 False。
len()
len() 方法用于计算序列的长度,即序列中元素的个数,
len(sequence)
max()
max() 方法用于计算序列中元素的最大值
max(sequence)
我们知道数字可以比较大小,那么序列(如字符串、列表等)是如何比较大小的呢?序列在比较大小的时候,会先将元素按照 ASCII 码表转换成数字,然后再进行比较,这样就可以得出最大值或者最小值了,如:
seq = "Hello, Python!"print(max(seq))
得到的结果是小写字母 y 。
max() 函数会先将 seq 的所有元素(每个字母、标点)转换成 ASCII码值,然后取出码值最大的元素打印出来。我们常用的字符,如数字、字母等,在 ASCII 码表中的码值大小依次是 数字。当然,ASCII 码表中不只包含数字、字母,其中还有许多标点符号、特殊符号(具体码表请自行查找)。
当然,如果我们想验证 max() 函数得到的结果是否正确,可以使用 ord() 函数获取 seq 中每个元素的 ASCII 码值,
seq = "Hello, Python!"lst = []for n in range(len(seq)):lst.append(ord(seq[n]))print(lst)
得到的结果是 [72, 101, 108, 108, 111, 44, 32, 80, 121, 116, 104, 111, 110, 33],从中可以看出最大值是 121,然后我们再用 chr() 函数看看 ASCII 码值 121 对应的字符是什么,
print(chr(121))
得到的结果也是小写字母 y 。
min()
min() 函数用于计算序列中元素的最小值,原理同 max() 函数一样。
字符串
字符串就是连续的字符序列,可以是计算机能够表示的所有字符的集合。
字符串不可变,在 Python 编程中,因为没有设置字符(char)类型,所以字符串通常使用引号(包括单引号、双引号、三引号)括起来,这三种引号没有本质上的差别,只是单引号、双引号中的内容必须在同一行,而三引号可以在连续的多行上。
常用操作
拼接字符串
使用 “+” 运算符可以将多个字符串拼接在一起,从而生成一个字符串。
重复字符串
使用 ”*“ 运算符可以重复字符串,类似数字的乘法。
计算字符串的长度
使用 len() 函数可以获取字符串中字符的个数,
len(string)
其中,string 表示要统计长度的字符串。
en() 函数在计算字符串长度时,不区分符号、数字、英文和汉字,所有字符均按一个字符进行计算。
但是,根据编码方式的不同,字符所占的字节数也不同(这里主要针对汉字,如采用 GBK/GB2312 编码,汉字占 2 个字节;而如果采用 UTF-8/unicode 编码,则汉字占 3 或 4 个字节。在 Python 编程中,数字、英文、符号、下划线和空格均占一个字节)。所以,如果需要取得字符串实际所占的字节数,就需要通过 encode() 方法指定编码格式,例如:
print(len("提放有度,自在为人;保持前进,以致更好!".encode("utf-8")))print(len("提放有度,自在为人;保持前进,以致更好!".encode("gbk")))
根据运行结果可以看出,同一句话,采用 UTF-8 编码方式每个汉字字符占 3 个字节,而如果采用 GBK 编码方式则每个汉字字符占 2 个字节。
截取字符串
截取字符串采用切片的方式实现,
string[startIndex : endIndex : step]
分割 & 合并字符串
- 分割字符串
把字符串按照指定的分隔符分成字符串列表,该列表中的元素不包含分隔符,
string.split(symbol, maxsplit)
其中,symbol 表示分隔符;maxsplit 表示分割次数,如果不指定则不限制次数。
print("提放有度,自在为人,保持前进,以致更好".split(","))
- 合并字符串
合并字符串正好与分割相反,是将多个字符串采用固定的分隔符连接在一起,
string = symbol.join(sequence)
例如,
list = ["小明