KNN算法-搜索最优超参数：n_neighbors /weight/p

最新推荐文章于 2025-03-22 23:35:41 发布

Genius9_9

最新推荐文章于 2025-03-22 23:35:41 发布

阅读量1.6w

点赞数 9

分类专栏：机器学习算法文章标签： KNN Python 超参数

本文链接：https://blog.csdn.net/Genius9_9/article/details/81057989

版权

机器学习算法专栏收录该内容

6 篇文章

订阅专栏

在本文中，将选取正确率作为衡量标准，自行实现搜索最优超参数，而非直接调用sklearn中的GridSearchCV。

先简单介绍KNN中的三个超参数：

超参数为:n_neighbors /weight/p（只有当weight=distance的时候，p值才有意义）

n_neighbors：取邻近点的个数k。k取1-9测试
weight：距离的权重；uniform：一致的权重；distance：距离的倒数作为权重
p:闵可斯基距离的p值; p=1:即欧式距离；p=2:即曼哈顿距离；p取1-6测试

#超参数为:n_neighbors /weight/p
# n_neighbors：取邻近点的个数k。k取1-9测试
#weight：距离的权重；uniform：一致的权重；distance：距离的倒数作为权重
#p:闵可斯基距离的p值; p=1:即欧式距离；p=2:即曼哈顿距离；p取1-6测试
#只有当weight=distance的时候，p值才有意义

def searchBestPar():
    bestScore=0
    bestK=-1
    bestWeight=""

    # weight==uniform时
    for k in range(1,10):
        clf = KNeighborsClassifier(n_neighbors=k,weights="uniform")
        clf.fit(trainX,trainY)
        scor=clf.score(testX,testY)
        if scor > bestScore:
            bestScore=scor
            bestK=k
            bestWeight="uniform"

    # weight==distance时
    for k in range(1,10):
        for p in range(1,7):
            clf=KNeighborsClassifier(n_neighbors=k,weights="distance",p=p)
            clf.fit(trainX,trainY)
            scor = clf.score(testX, testY)
            if scor > bestScore:
                bestScore = scor
                bestK = k
                bestWeight = "distance"

    print("the best n_neighbors", bestK)
    print("the best weights", bestWeight)
    print("the best p", p)

if __name__ == '__main__':
    iris=datasets.load_iris()
    trainX, testX, trainY, testY = train_test_split(iris.data,iris.target)
    searchBestPar()