numpy在处理数据的时候,经常会有切片操作,如提取指定几行的数据或者几列的数据,本文记录一些典型的切片方法以备日后查看。
一维数组的切片:
数组[start:end:step]
从start到end,以step为步长的元素
且:start < end.
>>> b=np.random.randint(1,10,[10])
>>> b
array([6, 5, 2, 3, 9, 9, 3, 8, 5, 8])
正向第i个元素到第j个元素:
>>> i=1
>>> j=8
>>> b[i:j]
array([5, 2, 3, 9, 9, 3, 8])
返回b[i],b[i+1],···,b[j-1]的元素
>>> i=1
>>> j=2
>>> b[i:j]
array([5])
我们发现是左闭右开,第j个元素不返回。
>>> b[::2]
array([6, 2, 9, 3, 5])
以2位步长,取下标为2的倍数的元素。
反向 倒数几个元素:
start和end为负数则是反向取元素,
取b[start+1] ,b[start+2],···,b[end]的元素
>>> b[-3:-1]
array([8, 5])
二维数组的切片
>>> a=np.random.randint(0,10,size=[4,5])
>>> a
array([[1, 8, 4, 9, 8],
[4, 1, 6, 4, 2],
[6, 4, 1, 2, 7],
[4, 9, 3, 5, 9]])
取 第i行到第j行:
>>> a[2:4,:]
array([[6, 4, 1, 2, 7],
[4, 9, 3, 5, 9]])
第i列到第j列:
>>> a[:,2:4]
array([[4, 9],
[6, 4],
[1, 2],
[3, 5]])
我们可以发现,多维的切片是在中括号中用逗号运算符, 将不同维上的操作分开,分割开后每个维度上单独维护即可。
另外
另外 numpy中对切片元素的操作是会影响到原数组本身的!
例如沿用上例的a矩阵:
>>> a[:1,:1]=[[100]]
>>> a
array([[100, 8, 4, 9, 8],
[ 4, 1, 6, 4, 2],
[ 6, 4, 1, 2, 7],
[ 4, 9, 3, 5, 9]])