numpy的函数应用

最新推荐文章于 2023-02-26 18:19:46 发布

挽歌亽朽年

最新推荐文章于 2023-02-26 18:19:46 发布

阅读量515

点赞数

分类专栏：数据分析

本文链接：https://blog.csdn.net/ghf183184/article/details/104678632

版权

数据分析专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1.numpy的基本操作函数
1）astype(dtype):对数组元素进行数据类型的转换

定义一维数组 a = [1,2,3,4]并将其元素转换为float类型

a = np.array([1,2,3,4])
a.dtype
Out[6]:
dtype(‘int32’)

b = a.astype(np.float)
b.dtype
Out[7]:
dtype(‘float64’)
a.dtype = np.float
a.dtype
Out[8]:
dtype(‘float64’)

2)reshape(tuple):对数组的维度进行调整

定义数组如下

#b = array([[ 0, 1, 2, 3, 4, 5, 6, 7],

[ 8, 9, 10, 11, 12, 13, 14, 15],

[16, 17, 18, 19, 20, 21, 22, 23],

[24, 25, 26, 27, 28, 29, 30, 31]])

b = np.arange(0,32,2).reshape(2,8)
b
Out[15]:
array([[ 0, 2, 4, 6, 8, 10, 12, 14],
[16, 18, 20, 22, 24, 26, 28, 30]])

import matplotlib.pyplot as plt
c = np.arange(0,1800).reshape(20,30,3)
plt.imshow©

将上述数组转换为一维数组array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31])

b.reshape(16)
Out[21]:
array([ 0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30])

3）concatenate((array1,array2,…),axix):将两个或多个数组相连
注意：在做行连接是必须保证两个或多个数组列数相同

定义数组n1 = [[1,2],[3,4]]和n2=[[‘a’,’‘b’],[‘c’,‘d’],[‘e’,‘f’]]

n1 = np.arange(1,7).reshape(3,2,)
n1
Out[37]:
array([[1, 2],
[3, 4],
[5, 6]])

n2 = np.array([[‘a’,‘b’],[‘c’,‘d’],[‘e’,‘f’]])
n2
Out[32]:
array([[‘a’, ‘b’],
[‘c’, ‘d’],
[‘e’, ‘f’]], dtype=’<U1’)

将n1和n2数组进行连接

np.concatenate((n1,n2))
Out[38]:
array([[‘1’, ‘2’],
[‘3’, ‘4’],
[‘5’, ‘6’],
[‘a’, ‘b’],
[‘c’, ‘d’],
[‘e’, ‘f’]], dtype=’<U11’)

将n1与n2按列进行连接

np.concatenate((n1,n2),axis=1)
Out[39]:
array([[‘1’, ‘2’, ‘a’, ‘b’],
[‘3’, ‘4’, ‘c’, ‘d’],
[‘5’, ‘6’, ‘e’, ‘f’]], dtype=’<U11’)
注：按行连接需要列相同，按列连接需要行相同

4）切分 split(array,num,axis):将数组array切分为num份。

将数组b平均分成两份

d = b.reshape(4,4)
d
Out[40]:
array([[ 0, 2, 4, 6],
[ 8, 10, 12, 14],
[16, 18, 20, 22],
[24, 26, 28, 30]])

np.split(d,2)
Out[41]:
[array([[ 0, 2, 4, 6],
[ 8, 10, 12, 14]]),
array([[16, 18, 20, 22],
[24, 26, 28, 30]])]

np.split(d,(1,3))
Out[45]:
[array([[0, 2, 4, 6]]),
array([[ 8, 10, 12, 14],
[16, 18, 20, 22]]),
array([[24, 26, 28, 30]])]

将数组b按列分为4份

np.split(d,4,axis=1)
Out[46]:
[array([[ 0],
[ 8],
[16],
[24]]),
array([[ 2],
[10],
[18],
[26]]),
array([[ 4],
[12],
[20],
[28]]),
array([[ 6],
[14],
[22],
[30]])]

2.统计函数
1）求和 sum（array,axis）
b
Out[49]:
array([[ 0, 2, 4, 6, 8, 10, 12, 14],
[16, 18, 20, 22, 24, 26, 28, 30]])

将数组b中元素求和

np.sum(b)
Out[48]:
240

将数组b中元素每一列的元素求和

np.sum(b,axis=0)
Out[51]:
array([16, 20, 24, 28, 32, 36, 40, 44])

将数组b中元素每一行的元素求和

np.sum(b,axis=1)
Out[52]:
array([ 56, 184])
axis的值为1时表示行，axis的值为0时表示列
2)算数平均值 mean(array,axis)

计算数组b的算数平均值

np.mean(b)
Out[53]:
15.0

计算数组b每一列元素的算数平均值

np.mean(b,axis=0)
Out[55]:
array([ 8., 10., 12., 14., 16., 18., 20., 22.])

计算数组b每一行元素的算数平均值

np.mean(b,axis=1)
Out[56]:
array([ 7., 23.])

3）加权平均值 average(array,weights=权重列表)

已知某同学的成绩为平时成绩=900.4 期末成绩=800.6，计算该同学的总成绩

score = np.array([90,80])
w = [0.4,0.6]
totle = np.average(score,weights=w)
totle
Out[58]:
84.0

4）方差 var(array,axis)

已知数据样本 n1 = [23,0.5,10,4,56,3] n2 = [12,18,21,13,15],判断哪个数据样本的波动较大

n3 = np.array([23,0.5,10,4,56,3])
n4 = np.array([12,18,21,13,15])
np.var(n3)
Out[63]:
373.03472222222234
np.var(n4)
Out[64]:
10.959999999999999

5)标准差 std(array,axis)

计算n1和n2的标准差

np.std(n3)
Out[67]:
19.314106819167755
np.std(n4)
Out[68]:
3.3105890714493698

6)最大值max(array,axis)

计算数组b的最大值

np.max(b)
Out[69]:
30

计算数组b每一行的最大值

np.max(b,axis=1)
Out[71]:
array([14, 30])

计算数组b每一列的最大值

np.max(b,axis=0)
Out[72]:
array([16, 18, 20, 22, 24, 26, 28, 30])

7）最小值min(array,axis)

计算数组b的最小值

np.min(b)
Out[74]:
0

计算数组b每一行的最小值

np.min(b,axis=1)
Out[75]:
array([ 0, 16])

计算数组b每一列的最小值

np.min(b,axis=0)
Out[76]:
array([ 0, 2, 4, 6, 8, 10, 12, 14])

8）最大值与最小值的差ptp(array,axis)

计算数组b最大值与最小值的差

np.ptp(b)
Out[77]:
30

计算数组b每一行最大最小值差

np.ptp(b,axis=1)
Out[78]:
array([14, 14])

计算数组b每一列最大最小值差

np.ptp(b,axis=0)
Out[80]:
array([16, 16, 16, 16, 16, 16, 16, 16])

9）最大值索引 argmax(array,axis)

将b中元素打乱

np.random.shuffle(b)
b
Out[81]:
array([[16, 18, 20, 22, 24, 26, 28, 30],
[ 0, 2, 4, 6, 8, 10, 12, 14]])

b中元素最大值的索引

np.argmax(b)
Out[82]:
7

np.argmax(b,axis=0)
Out[83]:
array([0, 0, 0, 0, 0, 0, 0, 0], dtype=int64)

np.argmax(b,axis=1)
Out[84]:
array([7, 7], dtype=int64)
10）累计求和cumsum()

计算b的累计和

np.cumsum(b)
Out[85]:
array([ 16, 34, 54, 76, 100, 126, 154, 184, 184, 186, 190, 196, 204,
214, 226, 240], dtype=int32)

计算数组b每一列的累计和

np.cumsum(b,axis=0)
Out[86]:
array([[16, 18, 20, 22, 24, 26, 28, 30],
[16, 20, 24, 28, 32, 36, 40, 44]], dtype=int32)

计算数组b每一行的累计和

np.cumsum(b,axis=1)
Out[87]:
array([[ 16, 34, 54, 76, 100, 126, 154, 184],
[ 0, 2, 6, 12, 20, 30, 42, 56]], dtype=int32)
11）累计求积cumprod()

计算b的累计和积

b.dtype = np.int64
np.cumprod(b)
Out[90]:
array([ 77309411344, 3058016715072, 109126529064448,
4045103278802944, 1847179534663680, 7388718138654720,
59109745109237760, 709316941310853120], dtype=int64)

计算数组b每一列的累计积

np.cumprod(b,axis=0)
Out[91]:
array([[ 77309411344, 94489280532, 111669149720, 128849018908],
[ 137438953472, 893353197648, 1924145348800, 3229815406928]],
dtype=int64)

计算数组b每一行的累计积

np.cumprod(b,axis=1)
Out[92]:
array([[ 77309411344, 3058016715072, 109126529064448,
4045103278802944],
[ 8589934592, 34359738368, 274877906944,
3298534883328]], dtype=int64)

3.排序函数
1）sort（array,axis）数值排序