工作中经常遇到求矩阵中非零元素个数的个数(L0范式)
下面介绍几种方法:
- 1、常规思路
import time
import numpy as np
data = np.array([
[5.0, 3.0, 4.0, 4.0, 0.0],
[3.0, 1.0, 2.0, 3.0, 3.0],
[4.0, 3.0, 4.0, 3.0, 5.0],
[3.0, 3.0, 1.0, 5.0, 4.0],
[1.0, 5.0, 5.0, 2.0, 1.0]
])
x,y = data.shape
num = 0
for i in range(0, x):
for j in range(0, y):
if array[i][j] > 0:
num += 1
print("L0 of data is:", num)
这是大多数人多常规思路,但是该方法在小矩阵,或小数据集上没有问题,一旦遇到大矩阵或者大数据集,性能太低,耗时太长
- 2 、尝试使用np 内部方法
import time
import numpy as np
data = np.array([
[5.0, 3.0, 4.0, 4.0, 0.0],
[3.0, 1.0, 2.0, 3.0, 3.0],
[4.0, 3.0, 4.0, 3.0, 5.0],
[3.0, 3.0, 1.0, 5.0, 4.0],
[1.0, 5.0, 5.0, 2.0, 1.0]
])
data[data < 0 ] = 0
data[data > 0] = 1
num = array.sum()
print("L0 of data is:", num)
这种方式就可以大大提高处理性能,面对大数据集也可以游刃有余
- 3、思路扩展
如果目标不是非零元素个数,而是小于或大于某一值threshold的元素个数呢
data[data < threshold ] = 0
data[data > threshold ] = 1
num = array.sum()
print("num of data is:", num)