关于kNN算法的更多思考

思考1

kNN算法是一种思想简单的分类算法,即计算预测结点距离它最近的k个结点,然后在这k个结点中看看属于哪个类别数量更多一些,就把它归为那一类。
但是,我们忽略了一个问题,那就是距离的权重,如下图所示:我们应该把它归为哪一类呢?

这里写图片描述

我们可以考虑把距离的倒数作为权重,即:红色距离绿色的权重为1/1=1,蓝色距离绿色的距离为1/3+1/4 = 7/12。 而1 > 7/12,所以应该把绿色归为红色类里面。

思考2

对于下图中的问题,如果按照距离最近的个数来进行分类的话,那么下图中出现了平票,但是如果给加上距离的权重,那么问题就迎刃而解了。

这里写图片描述

说明:

在scikit-learn中,对sklearn.neighbors.KNeighborsClassifier里的参数weight做了默认值为’uniform’即,不做处理。
但是,针对特殊情况,我们还需考虑这个权重的参数。
这里写图片描述

实战:

在手写识别中我们可以测验对于使用weights参数里的‘uniform’ 准确率更高一些还是使用’distance’准确率更高一些呢?(当然这个需要根据你当前项目跑一下)

for method in ['uniform', 'distance']:
    for k in range(1, 11):
        kNN_classifier = KNeighborsClassifier(n_neighbors=k, weights=method)
        kNN_classifier.fit(X_train, y_train)
        score = kNN_classifier.score(X_test, y_test)
        if score > best_score:
            best_score = score
            best_k = k
            best_method = method
print('best_k is %s'% best_k)
print('best_method is %s'% best_method)

输出结果为:
best_k is 3
best_method is uniform

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

. . . . .

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值