使用python处理问题的过程中,经常会遇到从某个序列中抽取部分值的情况。“切片”操作正是专门用于实现这一目的的方法。
实际上,可以通过单次或多次切片操作实现任意目标值切取。切片操作的基本语法很简单,下面就以列表来举例,说明Python的切片操作:
一、 Python切片的索引顺序
包括:正索引和负索引两部分,如下图所示,以list对象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例:
二、 Python切片操作方法:
一个完整的切片表达式包含两个“:”,用于分隔三个参数(start_index、end_index、step)。当只有一个“:”时,默认第三个参数step=1;当一个“:”也没有时,start_index=end_index,表示切取start_index指定的那个元素。
object[start_index:end_index:step]
step:正负数均可,其绝对值大小决定了切取数据时的‘‘步长”,而正负号决定了“切取方向”,正表示“从左往右”取值,负表示“从右往左”取值。当step省略时,默认为1,即从左往右以步长1取值。“切取方向非常重要!”“切取方向非常重要!”“切取方向非常重要!”,重要的事情说三遍!
start_index:表示起始索引(包含该索引对应值);该参数省略时,表示从对象“端点”开始取值,至于是从“起点”还是从“终点”开始,则由step参数的正负决定,step为正从“起点”开始,为负从“终点”开始。
end_index:表示终止索引(不包含该索引对应值);该参数省略时,表示一直取到数据“端点”,至于是到“起点”还是到“终点”,同样由step参数的正负决定,step为正时直到“终点”,为负时直到“起点”。
三、示例:
光说不练假把式,记住一个口诀:顾首不顾腚。
下面我就举例子来展示,我先创建一个空列表,增加几个数字。
# 创建一个空列表,向里面添加几个整数,score[100, 99, 88, 77, 66, 55]
score = []
score.append(100)
score.append(99)
score.append(88)
score.append(77)
score.append(66)
score.append(55)
print(score)
这个列表如下:
[100, 99, 88, 77, 66, 55]
1、索引这个列表中的单个元素:
>>>score[0]
>>>100
>>>score[1]
>>>99
>>>score[-1]
>>>55
>>>score[-3]
>>77
2、切片方向要记清
>>>score[:] #从左往右
>>> [100, 99, 88, 77, 66, 55]
>>>score[::]#从左往右
>>> [100, 99, 88, 77, 66, 55]
>>>score[::-1]#从右往左
>>> [55, 66, 77, 88, 99, 100]
3. start_index和end_index全为正(+)
>>>score[1:4]
>>> [99, 88, 77] #这样取值有个口诀叫“顾头不顾腚”
step=1,从左往右取值,start_index=1到end_index=4同样表示从左往右取值。
>>>score[1:4:-1]
>>> []
输出为空列表,说明没取到数据。
step=-1,决定了从右往左取值,而start_index=1到end_index=4决定了从左往右取值,两者矛盾,所以为空。
>>>score[4:2]
>>> []
同样输出为空列表。
step=1,决定了从左往右取值,而start_index=4到end_index=2决定了从右往左取值,两者矛盾,所以为空。
>>>score[:4]
>>> [100, 99, 88, 77]
step=1,表示从左往右取值,而start_index省略时,表示从端点开始,因此这里的端点是“起点”,即从“起点”值0开始一直取到end_index=4(该点不包括,顾头不顾腚)。
>>>score[:2:-1]
>>> [55, 66, 77]
step=-1,从右往左取值,而start_index省略时,表示从端点开始,因此这里的端点是“终点”,即从“终点”值55开始一直取到end_index=2(该点不包括,顾头不顾腚)。
>>>score[3:]
>>> [77, 66, 55]
step=1,从左往右取值,从start_index=3开始,一直取到“终点”值55。
>>>score[3::-1]
>>> [77, 88, 99, 100]
step=-1,从右往左取值,从start_index=3开始,一直取到“起点”100。
4. start_index和end_index全为负(-)
>>>score[-1:-4]
>>> []
step=1,从左往右取值,而start_index=-1到end_index=-4决定了从右往左取值,两者矛盾,所以为空。
索引-1在-4的右边
>>>score[-1:-4:-1]
>>> [55, 66, 77]
step=-1,从右往左取值,start_index=-1到end_index=-4同样是从右往左取值。
索引-1在-4的右边
>>>score[-4:-1]
>>> [88, 77, 66]
step=1,从左往右取值,而start_index=-4到end_index=-1同样是从左往右取值。
索引-4在-1的左边
>>>score[:-4]
>>> [100, 99]
step=1,从左往右取值,从“起点”开始一直取到end_index=-4(该点不包括,顾首不顾腚)。
>>>score[:-4:-1]
>>> [55, 66, 77]
step=-1,从右往左取值,从“终点”开始一直取到end_index=-4(该点不包括,顾首不顾腚)。
>>>score[-4:]
>>> [88, 77, 66, 55]
step=1,从左往右取值,从start_index=-4开始,一直取到“终点”。
>>>score[-4::-1]
>>> [88, 99, 100]
step=-1,从右往左取值,从start_index=-4开始,一直取到“起点”。
5. start_index和end_index正(+)负(-)混合
>>>score[1:-2]
>>> [99, 88, 77]
start_index=1在end_index=-2的左边,因此从左往右取值,而step=1同样决定了从左往右取值.
>>>score[1:-4:-1]
>>> []
start_index=1在end_index=-4的左边,因此从左往右取值,但step=-1则决定了从右往左取值,两者矛盾,因此为空。
>>>score[-1:4]
>>> []
start_index=-1在end_index=4的右边,因此从右往左取值,但step=1则决定了从左往右取值,两者矛盾,因此为空。
>>>score[-1:2:-1]
>>> [55, 66, 77]
start_index=-1在end_index=2的右边,因此从右往左取值,而step=-1同样决定了从右往左取值,因此结果正确。
6. 多层切片,慎用
>>>score[:5][2:4][-1:]
>>> [77]
相当于:
score[:5] = [100, 99, 88, 77, 66]
score[:5][2:4] = [88, 77]
score[:5][2:4][-1:]= [77]
理论上可无限次多层切片操作,只要上一次返回的是非空可切片对象即可。
7. 切片操作的三个参数可以用表达式,慎用
>>>score[1+1:2*2:7%6]
>>>[88, 77]
8、其他序列的切片
元组:
>>> (0, 1, 2, 3, 4, 5)[:3]
>>> (0, 1, 2)
字符串:
>>>'ABCDEFG'[::2]
>>>'ACEG'
循环对象:
>>>for i in range(1,100)[2::3][-5:]:
print(i)
>>>87
90
93
96
99
就是利用range()函数生成1-99的整数,然后从start_index=2(即3)开始以step=3取值,直到终点,再在新序列中取最后五个数。
四、 常用技巧举例
示例: 设有列表a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
1、取偶数位置:
>>>b = a[::2]
[0, 2, 4, 6, 8]
2、取奇数位置:
>>>b = a[1::2]
[1, 3, 5, 7, 9]
3、拷贝
>>>b = a[:] #
>>>print(b) #[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) #41946376
>>>print(id(b)) #41921864
或
>>>b = a.copy()
>>>print(b) #[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) #39783752
>>>print(id(b)) #39759176
需要注意的是:[:]和.copy()都属于“浅拷贝”,只拷贝最外层元素,内层嵌套元素则通过引用方式共享,而非独立分配内存,如果需要彻底拷贝则需采用“深拷贝”方式,如下例所示:
>>>a = [1,2,['A','B']]
>>>print('a={}'.format(a))
>>>b = a[:]
>>>b[0] = 9 #修改b的最外层元素,将1变成9
>>>b[2][0] = 'D' #修改b的内嵌层元素
>>>print('a={}'.format(a))
>>>print('b={}'.format(b))
>>>print('id(a)={}'.format(id(a)))
>>>print('id(b)={}'.format(id(b)))
a=[1, 2, ['A', 'B']] #原始a
a=[1, 2, ['D', 'B']] #b修改内部元素A为D后,a中的A也变成了D,说明共享内部嵌套元素,但外部元素1没变。
b=[9, 2, ['D', 'B']] #修改后的b
id(a)=38669128
id(b)=38669192
4、修改
>>>a[3] = ['A','B']
[0, 1, 2, ['A', 'B'], 4, 5, 6, 7, 8, 9]
5、插入
>>>a[3:3] = ['A','B','C']
[0, 1, 2, 'A', 'B', 'C', 3, 4, 5, 6, 7, 8, 9]
>>>a[0:0] = ['A','B']
['A', 'B', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
6、替换
>>>a[3:6] = ['A','B']
[0, 1, 2, 'A', 'B', 6, 7, 8, 9]
五、 规则总结
1、start_index、step近视眼,方向在哪要看清:
start_index、end_index、step三者可同为正、同为负,或正负混合。但必须遵循一个原则,即:当start_index表示的实际位置在end_index的左边时,从左往右取值,此时step必须是正数(同样表示从左往右);当start_index表示的实际位置在end_index的右边时,表示从右往左取值,此时step必须是负数(同样表示从右往左),即两者的取值顺序必须相同。
2、start_index、end_index不在家,方向要听step:
当start_index或end_index省略时,取值的起始索引和终止索引由step的正负来决定,这种情况不会有取值方向矛盾(即不会返回空列表[]),但正和负取到的结果顺序是相反的,因为一个向左一个向右。
3、step省略要小心,还有小1看不清:
step的正负是必须要考虑的,尤其是当step省略时。比如score[-1:],很容易就误认为是从“终点”开始一直取到“起点”,即score[-1:]=[100, 99, 88, 77, 66, 55],但实际上score[-1:]=[55](注意不是55),原因在于step省略时step=1表示从左往右取值,而起始索引start_index=-1本身就是对象的最右边元素了,再往右已经没数据了.
4、见到冒号要小心,返回类型要弄清:
“取单个元素(不带“:”)”时,返回的是对象的某个元素,其类型由元素本身的类型决定,而与母对象无关,如上面的score[0]=100、score[-4]=88,元素100和88都是“数值型”,而母对象score却是“list”型;“取连续切片(带“:”)”时,返回结果的类型与母对象相同,哪怕切取的连续切片只包含一个元素,如上面的score[-1:]=[55],返回的是一个只包含元素“55”的list,而非数值型“55”。