Python基础（一）：Python切片，浅拷贝、深拷贝和赋值，排序，Reduce函数

最新推荐文章于 2022-10-13 20:31:28 发布

大饼博士X

最新推荐文章于 2022-10-13 20:31:28 发布

阅读量5.1k

点赞数 11

分类专栏：知识收录、转载区文章标签： python

本文链接：https://blog.csdn.net/xbinworld/article/details/104203829

版权

知识收录、转载区专栏收录该内容

20 篇文章 3 订阅

订阅专栏

文章目录

Python切片操作
Python赋值、浅拷贝、深拷贝的区别
Python常用内置对象的排序
Reduce函数 [5]
参考资料

整理一下Python常用操作，包括Python切片操作、拷贝、排序、Numpy基础等，会持续更新，主要是自己mark用。主要以Python3来记录。

Python切片操作

经常会需要从某个对象中抽取部分值的情况，Python通过切片操作来实现。包括list、dict、字符串、tuple等都是可以的，且切片原理是一样的。这一部分主要参考了[1]。

索引方式包括：正索引和负索引两部分，如下图所示，以list对象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例：
在这里插入图片描述
一个完整的切片表达式包含两个“:”，用于分隔三个参数(start_index、end_index、step)。当只有一个“:”时，默认第三个参数step=1；当一个“:”也没有时，start_index=end_index，表示切取start_index指定的那个元素。

object[start_index:end_index:step]

start_index：表示起始索引（包含该索引对应值）；该参数省略时，表示从对象“端点”开始取值，至于是从“起点”还是从“终点”开始，则由step参数的正负决定，step为正从“起点”开始，为负从“终点”开始。
end_index：表示终止索引（不包含该索引对应值）；该参数省略时，表示一直取到数据“端点”，至于是到“起点”还是到“终点”，同样由step参数的正负决定，step为正时直到“终点”，为负时直到“起点”。
step：正负数均可，其绝对值大小决定了切取数据时的‘‘步长”，正表示“从左往右”取值，负表示“从右往左”取值。当step省略时，默认为1，即从左往右以步长1取值。

基本用法

>>>a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>a[0]
0

>>>a[-4]
6
当索引只有一个数时，表示切取某一个元素。

>>>a[:] 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
从左往右取全部

>>>a[::]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
从左往右取全部

>>>a[::-1]
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
从右往左倒序取，这几个很常用

>>>b = a[::2]
[0, 2, 4, 6, 8]
取偶数

>>>b = a[1::2]
[1, 3, 5, 7, 9]
取奇数

需要注意：“取单个元素（不带“:”）”时，返回的是对象的某个元素，其类型由元素本身的类型决定，而与母对象无关，如上面的a[0]=0、a[-4]=6，元素0和6都是“数值型”，而母对象a却是“list”型；“取连续切片（带“:”）”时，返回结果的类型与母对象相同，哪怕切取的连续切片只包含一个元素，如a[-1:]=[9]，返回的是一个只包含元素“9”的list，而非数值型“9”。

根据索引取部分数据

>>>a[1:6]
[1, 2, 3, 4, 5]
step=1，从左往右取值，start_index=1到end_index=6同样表示从左往右取值。

>>>a[1:6:-1]
[]
输出为空列表，说明没取到数据。
step=-1，决定了从右往左取值，而start_index=1到end_index=6决定了从左往右取值，
两者矛盾，所以为空。

>>>a[:6]
[0, 1, 2, 3, 4, 5]
step=1，表示从左往右取值，而start_index省略时，表示从端点开始，
因此这里的端点是“起点”，即从“起点”值0开始一直取到end_index=6（该点不包括）。

>>>a[:6:-1]
[9, 8, 7]
step=-1，从右往左取值，而start_index省略时，表示从端点开始，
因此这里的端点是“终点”，即从“终点”值9开始一直取到end_index=6（该点不包括）。

>>>a[-1:-6]
[]
step=1，从左往右取值，而start_index=-1到end_index=-6决定了从右往左取值，两者矛盾，所以为空。
索引-1在-6的右边

>>>a[-1:-6:-1]
[9, 8, 7, 6, 5]
step=-1，从右往左取值，start_index=-1到end_index=-6同样是从右往左取值。

>>>a[:-6]
[0, 1, 2, 3]
step=1，从左往右取值，从“起点”开始一直取到end_index=-6（该点不包括）。

>>>a[-6::-1]
[4, 3, 2, 1, 0]
step=-1，从右往左取值，从start_index=-6开始，一直取到“起点”。

>>>a[-1:6:-1]
[9, 8, 7]
start_index=-1在end_index=6的右边，因此从右往左取值，而step=-1同样决定了从右往左取值，因此结果正确。

>>>a[2+1:3*2:7%3]
[3, 4, 5]
即：a[2+1:3*2:7%3] = a[3:6:1]

注意：

start_index、end_index、step三者可同为正、同为负，或正负混合。但必须遵循一个原则，即：当start_index表示的实际位置在end_index的左边时，从左往右取值，此时step必须是正数（同样表示从左往右）；当start_index表示的实际位置在end_index的右边时，表示从右往左取值，此时step必须是负数（同样表示从右往左），即两者的取值顺序必须相同。
当start_index或end_index省略时，取值的起始索引和终止索引由step的正负来决定，这种情况不会有取值方向矛盾（即不会返回空列表[]），但正和负取到的结果顺序是相反的，因为一个向左一个向右。
step的正负是必须要考虑的，尤其是当step省略时。比如a[-1:]，很容易就误认为是从“终点”开始一直取到“起点”，即a[-1:]= [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]，但实际上a[-1:]=[9]（注意不是9），原因在于step省略时step=1表示从左往右取值，而起始索引start_index=-1本身就是对象的最右边元素了，再往右已经没数据了，因此结果只含有9一个元素。

多层切片

>>>a[:8][2:5][-1:]
[4]
相当于：
a[:8]=[0, 1, 2, 3, 4, 5, 6, 7]
a[:8][2:5]= [2, 3, 4]
a[:8][2:5][-1:] = [4]
理论上可无限次多层切片操作，只要上一次返回的是非空可切片对象即可。

其他对象的切片操作

>>> (0, 1, 2, 3, 4, 5)[:3]
(0, 1, 2)
元组的切片操作

>>>'ABCDEFG'[::2]
'ACEG'
字符串的切片操作

>>>for i in range(1,100)[2::3][-5:]: 
       print(i)
87
90
93
96
99
就是利用range()函数生成1-99的整数，然后从start_index=2（即3）开始以step=3取值，
直到终点，再在新序列中取最后五个数。

修改单个元素、在某个位置插入元素

>>>a[3] = ['A','B']
[0, 1, 2, ['A', 'B'], 4, 5, 6, 7, 8, 9]
修该第四个元素为一个list

>>>a[3:3] = ['A','B','C']
[0, 1, 2, 'A', 'B', 'C', 3, 4, 5, 6, 7, 8, 9]
插入几个元素，而不是修该，也不是插入一个list

>>>a[0:0] = ['A','B']
['A', 'B', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Python赋值、浅拷贝、深拷贝的区别

[:]和.copy()都属于“浅拷贝”，只拷贝最外层元素，外层元素是独立内存；内层嵌套元素则通过引用方式共享，而非独立分配内存。使用 copy 模块的 copy.copy（浅拷贝）和 copy.deepcopy（深拷贝），其中deepcopy是构建了一个完全独立的对象。

1、b = a: 赋值引用，a 和 b 都指向同一个对象。
在这里插入图片描述
2、b = a.copy(): 浅拷贝, a 和 b 是一个独立的对象，但他们的子对象（内层嵌套对象）还是指向统一对象（是引用）。

3、b = copy.deepcopy(a): 深度拷贝, a 和 b 完全拷贝了父对象及其子对象，两者是完全独立的。
在这里插入图片描述
例子：

>>>a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>b = a[:]
>>>print(b)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) #41946376
>>>print(id(b)) #41921864
或
>>>b = a.copy()
>>>print(b) 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) #39783752
>>>print(id(b)) #39759176

>>>a = [1,2,['A','B']]
>>>print('a={}'.format(a))
>>>b = a[:]
>>>b[0] = 9 #修改b的最外层元素，将1变成9
>>>b[2][0] = 'D' #修改b的内嵌层元素
>>>print('a={}'.format(a))
>>>print('b={}'.format(b))
>>>print('id(a)={}'.format(id(a)))
>>>print('id(b)={}'.format(id(b)))
a=[1, 2, ['A', 'B']] #原始a
a=[1, 2, ['D', 'B']] #b修改内部元素A为D后，a中的A也变成了D，说明共享内部嵌套元素，但外部元素1没变。
b=[9, 2, ['D', 'B']] #修改后的b
id(a)=38669128
id(b)=38669192

深拷贝：

import copy
a = [1, 2, 3, 4, ['a', 'b']] #原始对象
 
b = a                       #赋值，传对象的引用
c = copy.copy(a)            #对象拷贝，浅拷贝
d = copy.deepcopy(a)        #对象拷贝，深拷贝
 
a.append(5)                 #修改对象a
a[4].append('c')            #修改对象a中的['a', 'b']数组对象
 
print( 'a = ', a )
print( 'b = ', b )
print( 'c = ', c )
print( 'd = ', d )

输出：
'a = ', [1, 2, 3, 4, ['a', 'b', 'c'], 5]
'b = ', [1, 2, 3, 4, ['a', 'b', 'c'], 5]
'c = ', [1, 2, 3, 4, ['a', 'b', 'c']]
'd = ', [1, 2, 3, 4, ['a', 'b']]

Python常用内置对象的排序

Python中对各种数据结构：列表、元组、字典（list、tuple、dict）进行排序，用到sort、sorted、heapq、Counter等[4]。

sort

sort 是对 list 进行原地址排序，也就是改变原有的 list 。因此，不会增加内存的占用，但会产出数据被修改的副作用

>>>x = [2, 5, 3, 4, 1]
>>>x.sort()
>>>print(x)
[1, 2, 3, 4, 5]
从小到大排序

>>>x = [2, 5, 3, 4, 1]
>>>x.sort(reverse=True)
>>>print(x)
[5, 4, 3, 2, 1]
从大到小排序

sorted

很多时候，我们只是想得到排序的结果，而不想改变原数据。sorted 则没有对原数据进行操作，而是构建一个新的数据，这样就保留了原数据，但会增加内存的占用。不过，sorted 要比 sort 适用更广泛，可以应用于 list 、tuple 和 dict 等数据结构。

x = [2, 5, 3, 4, 1]
y = sorted(x, reverse=True)
print('x:', x)
print('y:', y)

x: [2, 5, 3, 4, 1]
y: [5, 4, 3, 2, 1]

这与 sort 的基础用法很类似，但接下来就是 sorted 强大之处了，可以对字典按照value排序

a = {'a': 2, 'b': 5, 'c': 3, 'd': 4, 'e': 1}
b = sorted(a.items(), key=lambda x: x[1], reverse=True)
print(b)

[('b', 5), ('d', 4), ('c', 3), ('a', 2), ('e', 1)]

heapq

有时候，我们需要动态地进行排序，快速找出 TOP 的数据，此时 heapq （堆排序）就可以大显身手了。普通排序和sorted比没什么优势，如果遇到动态添加数据的时候，它的优势就显现出来了，比如：在线投票，需要实时出现结果。如果用 sorted 排序，那么每次都需要重排，时间复杂度极高。heapd 可以持续往里面添加，并快速完成新元素的排序。

import heapq
x = [2, 5, 3, 4, 1]
heap = []
for i in x:
    heapq.heappush(heap, i)
print(heap[:])

[1, 2, 3, 4, 5]
实现堆排序


print([heapq.heappop(heap) for _ in range(len(x))])
[1, 2, 3, 4, 5]
print(heap[:])
[]
POP会把heap里面的数据按顺序蹦出来，一次蹦一个。

collection.Counter

在实际的工作中，很多原始数据的结构，并不是我们能直接用 sorted 等排序的类型，需要一些前置的处理工作，而这些工作往往都重复的，所以，Python 为我们提供了 collection.Counter 来优雅处理这类问题

from collection import Counter

cng = Counter()
words = ['red', 'blue', 'red', 'green', 'red', 'blue']

for word in words:
	cnt[word] += 1

print(cnt)
Counter({'red':3, 'blue': 2, 'green': 1})

# 获取前2个
print(cnt.most_common(2))
[('red', 3), ('blue', 2)]

Reduce函数 [5]

在python3中如果使用reduce需要先导入
from functools import reduce

reduce函数，reduce函数会对参数序列中元素进行累积。
reduce函数的定义：

reduce(function, sequence [, initial] ) -> value

function参数是一个有两个参数的函数，reduce依次从sequence中取一个元素，和上一次调用function的结果做参数再次调用function。
第一次调用function时，如果提供initial参数，会以sequence中的第一个元素和initial作为参数调用function，否则会以序列sequence中的前两个元素做参数调用function。

举例：
（1）比如有列表lst=[1,2,3,4],我们希望得到列表每个元素之和,代码如下:

from functools import reduce
lst=[1,2,3,4]
print(reduce(lambda x,y: x+y, lst))
>>>
24

from functools import reduce
lst=[1,2,3,4]
print(reduce(lambda x,y: x*y+1, lst))

计算过程如下:
这个式子只有两个参数,没有初始化值,那么就取列表前2项,通过lambda函数计算结果
1*2+1=3,
上面计算的结果在与列表第三个元素通过lambda函数计算
3*3+1=10
上面计算的结果在与列表第四个元素通过lambda函数计算
10*4+1=41

from functools import reduce
lst=[1,2,3,4]
print(reduce(lambda x,y: x+y, lst,5))

5是初始值,也可以理解为第三个参数
计算过程：
-->5+1=6
-->6+2=8
-->8+3=11
-->11+4=15

参考资料

[1] 彻底搞懂Python切片操作, https://www.jianshu.com/p/15715d6f4dad
[2] https://www.runoob.com/w3cnote/python-understanding-dict-copy-shallow-or-deep.html
[3] https://blog.csdn.net/bufengzj/article/details/90486991
[4] https://blog.csdn.net/qq_39839807/article/details/104112415
[5] https://www.cnblogs.com/apollo1616/articles/9785335.html