借助sklearn机器学习工具库
代码比较简洁易懂,内有详细的解释和步骤。
直接复制,带入数据,进行调用,即可出结果。
其中选取的邻近n个点作为分类参考,参数n可以通过不断的调试,配合模型评价结果来获得最优参数值
代码如下:
def KNN(X_train, Y_train, X_test, Y_test, n):
"""
X_train: 特征训练集
Y_train: 标注训练集
X_test: 特征测试集
Y_test: 标注测试集
n: 选择邻近的n个点来对目标进行分类
"""
# 01.创建模型
from sklearn.neighbors import KNeighborsClassifier
knn_model = KNeighborsClassifier(n_neighbors=n)
# 02.训练模型
knn_model.fit(X_train, Y_train)
# 03.预测
Y_pred = knn_model.predict(X_test)
# 04.模型评价(accuracy_score:准确率;recall_score:召回率; f1_score:F值)
from sklearn.metrics import accuracy_score, recall_score, f1_score
print('ACC:', accuracy_score(Y_test, Y_pred))
print('REC:', recall_score(Y_test, Y_pred))
print('F-Score:', f1_score(Y_test, Y_pred))
return
这里的模型评价指标选择了:
① accuracy_score:准确率;
② recall_score:召回率;
③ f1_score:F值。
在上面代码中都是针对测试集的效果,也可以对训练集进行预测,然后评价训练集的效果,综合比较,可以看看是否会出现过拟合现象。