numpy.argpartition函数的理解
在进行knn练习的时候,看到了一段
closest_y = self.y_train[np.argpartition(dists[i],k)[0:k]]
的代码,下面是个人对argpartition函数的理解。
首先我们要明白的是argpartition函数输出的是一个索引数组
定义一个乱序的数组
dists= np.array([ 3.0, 2.0, 5.0, 4.0, 7.0, 6.0, 1.0, 0.0])
首先我定义,k = 5,相当于跑步成绩里第k名
这个函数输出结果是,将成绩比第K名好的索引号放在K前面(时间短),差的放在K后面。(无序放置)
k = 5
print(np.argpartition(dists, k))
>> array([1 7 6 0 3 2 5 4])
最后输出排序后的结果
print(dists[np.argpartition(dists, k)])
>> array([2. 0. 1. 3. 4. 5. 6. 7.])
如果只取X个比k名次还高的
X = 4
print(dists[np.argpartition(dists, k)[:X]])
>> array([2. 0. 1. 3.])
其它k和X
k = 6
X = 6
print(np.argpartition(dists, k))
print(dists[np.argpartition(dists, k)])
print(dists[np.argpartition(dists, k)[:X]])
>> array([1 7 6 0 2 3 5 4])
>> array([2. 0. 1. 3. 5. 4. 6. 7.])
>> array([2. 0. 1. 3. 5. 4.])