引言
前面通过几篇文章,把Python中的容器,包括列表、元组、字典的基本使用介绍了一遍。当然,只是在笔者看来,比较实用的功能。但是,不可否认的是,肯定是挂一漏万。
有些内容,是相对简单的,随便找本Python的教材,或者自行通过搜索引擎检索,可以轻易掌握。
有些内容,是稍微不那么常用的,填鸭式的学一遍,一直没有使用场景,学起来也是没有太大意义的,我一直提倡的是以用促学。用不到的东西,一直不学也是没关系的。
但是,由于知识的诅咒的存在,有些内容,在老手看来,很简单,但新手自学中,很可能有些困惑,但是教材中却对这些困惑未做理会。所以,我准备花几篇文章的篇幅,就Python容器中简单但容易引起困惑的内容,做一些补充说明。
本文,就关于序列类型的切片做一些补充说明。
切片的基本用法
关于切片的基本用法,随处可见,这里只做简单的演示说明,不就各种变化展开说明。
切片(slice)是序列类型中,比较常用且强大的一种功能,用于从序列(如列表、元组、字符串等)提取某个子集的元素。基本语法如下:
sequence[start:stop:step]
其中:
- start是起始索引(包含)
- stop是终止索引(不包含)
- step是步长,通常可以省略,默认为1
通过start、stop、step的不同组合,可以实现切片的很多种变化,简单通过代码演示下偶数索引切片、奇数索引切片和列表倒序的使用:
a = [x for x in range(10)]
print(a)
# 取出偶数索引元素的切片
slice1 = a[::2]
print(slice1)
# 取出奇数索引元素的切片
slice2 = a[1::2]
print(slice2)
# 列表元素逆序
b = a[::-1]
print(b)
执行结果:
从定义看切片的实现
为了说明下序列切片的实现,需要提前看一下列表中[]语法背后的魔法函数__getitem__()
。(关于魔法函数,后面会有专门的文章详细解释,这里不理解也没有关系)。
Python中,序列支持[]的索引操作,其背后,都是调用该序列对象的__getitem__()
方法,看文档描述:
比较简单,只描述了[]操作的底层调用。
从方法的调用方式,也可以看到:
list的__getitem__()支持两种方式调用:
1、传入一个整数的索引
2、传入一个slice对象
所谓的slice对象的定义:
我们通过start:stop:step方式的[]操作,其实都是先构建一个slice()对象。
虽然,我们不一定需要自己实现一个自定义的序列类型,但是了解slice对象,还是有一些帮助的,比如,构造slice切片对象,从而实现动态的切片。
这部分内容,不展开来说了,只是稍微看下[]的背后实现。
切片为什么要排除最后一项
关于这一点,刚接触编程的新手,可能不太能够理解,当然,随着用得多了,大概也能记下来,切片的范围都是左闭右开的一个区间。
但是,记下来了,是一回事,能不能理解就是另外一回事了。
我们稍微从设计者的角度推测一下,为什么切片要排除最后一项,这样做一定有些在使用者实际使用上的好处:
1、方便切片中元素个数的计算
首先,如果在切片中,仅指定了stop结束位置,我们可以更加容易地判断出切片或者区间的长度,比如:range(3)一定是长度为3,list1[:3]也一定是只有3个元素。
其次,如果是同时指定了start和stop,通过stop-start也是可以很容易计算出切片或区间的长度的。
2、方便地在指定索引处将一个序列切分为两个部分且不重叠:
a = [x for x in range(10)]
print(a)
# 比如,从第索引3开始,将列表a切分为两个不重叠的部分
part1 = a[:3]
part2 = a[3:]
print(part1)
print(part2)
执行结果:
关于上面提到的两点好处,Edsger W. Dijkstra有一份手写版的备忘录,对其进行了说明,感兴趣地自行查阅:《Why numbering should start at zero》。
链接地址:https://www.cs.utexas.edu/~EWD/ewd08xx/EWD831.PDF
切片的赋值操作
在赋值语句的左侧,可以使用切片表示法,或者作为del语句的目标,从而实现更加强大的批量插入、更改、删除等操作方式,批量修改序列的元素。
需要注意的是,如果赋值的目标是一个切片,则右边必须是一个可迭代对象,即使只有一项。
1、实现元素的批量插入
a = [x for x in range(10)]
print(a)
# 实现批量插入的功能
# 在列表的头部插入两个元素
a[:0] = [-2, -1]
print(a)
# 在列表的中间位置插入多个元素
a[3:3] = [100 * x for x in range(1, 5)]
print(a)
# 在列表尾部添加多个元素(任意大于列表长度的索引值)
a[100:] = [x ** 3 for x in range(1, 5)]
# a[len(a):] = [x ** 3 for x in range(1, 5)]
print(a)
执行结果:
2、实现元素的批量更改替换
a = [x for x in range(10)]
print(a)
# 前三个元素替换为100,相当于删除前3个元素,然后再插入100
# 两边的长度可以不相等
a[:3] = [100]
print(a)
# 实现隔一个修改一个,切片如果不是连续的,则两边长度必须相等,否则报错(应该很好理解)
# a[::2] = [500] * 3
a[::2] = [500] * 4
print(a)
执行结果:
3、实现元素的批量删除
a = [x for x in range(10)]
print(a)
# 删除前两个元素,等价于:del a[:2]
a[:2] = []
print(a)
# 隔一个元素删除一个
del a[::2]
print(a)
# 删除最后两个元素
del a[-2:]
print(a)
执行结果: