解决ValueError: Expected n_neighbors <= n_samples, but n_samples = 4, n_neighbors = 5问题
在进行mtcnn+facenet+knn的人了识别时
报了:
ValueError: Expected n_neighbors <= n_samples, but n_samples = 4, n_neighbors = 5
错误。
1、错误原因:训练集中样本个数比默认的 k 要少,无法找出前k个距离以至无法投票进行分类。
以简单的例子说明:
# 原来的代码
import numpy as np
from sklearn import neighbors
group = np.array([[1,101],[5,89],[108,5],[115,8]]) # 训练集
labels = np.array(['级别A','级别A','级别B','级别B']) # 训练集对应的类别标签
knn = neighbors.KNeighborsClassifier()
model=knn.fit(group,labels) # 训练分类模型
print(knn.predict([[101,20]])) # 预测[101,20]属于哪类
上面的代码报错。KNeighborsClassifier()中的参数n_neighbors默认等于5,而训练集样本只有4个,无法分类。
2.1、解决方式一:更改默认的n_neighbors参数值,使参数值小于训练集中的样本个数
# 修改参数后代码
import numpy as np
from sklearn import neighbors
group = np.array([[1,101],[5,89],[108,5],[115,8]]) # 训练集
labels = np.array(['级别A','级别A','级别B','级别B']) # 训练集对应的类别标签
knn = neighbors.KNeighborsClassifier(n_neighbors=3) # n_neighbors改为3
model=knn.fit(group,labels) # 训练分类模型
print(knn.predict([[101,20]])) # 预测[101,20]属于哪类
2.2、解决方式二:增加训练集样本的个数,使分类更加准确。
在我的工程中。我是在_classification.py改了