KNN算法实现

Predilection...

已于 2022-04-22 14:15:55 修改

阅读量1.6k

点赞数 1

分类专栏：笔记文章标签： python 机器学习

于 2022-04-13 19:47:35 首次发布

本文链接：https://blog.csdn.net/qq_52487370/article/details/124145729

版权

KNN算法实现

一、用KNN将分类好的数据

1、算法概述

KNN算法

2、各参数的实际意义

 def KNeighborsClassifier(n_neighbors = 5,
                        weights='uniform',
                        algorithm = '',
                        leaf_size = '30',
                        p = 2,
                        metric = 'minkowski',
                        metric_params = None,
                        n_jobs = None
                        )
 										
 
 - n_neighbors：这个值就是指 KNN 中的 “K”了。前面说到过，通过调整 K 值，算法会有不同的效果。
 - weights（权重）：最普遍的 KNN 算法无论距离如何，权重都一样，但有时候我们想搞点特殊化，比如距离更近的点让它更加重要。这时候就需要 weight 这个参数了，这个参数有三个可选参数的值，决定了如何分配权重。参数选项如下：
       • 'uniform'：不管远近权重都一样，就是最普通的 KNN 算法的形式。
       • 'distance'：权重和距离成反比，距离预测目标越近具有越高的权重。
       • 自定义函数：自定义一个函数，根据输入的坐标值返回对应的权重，达到自定义权重的目的。
 - algorithm：在 sklearn 中，要构建 KNN 模型有三种构建方式，1. 暴力法，就是直接计算距离存储比较的那种放松。2. 使用 kd 树构建 KNN 模型 3. 使用球树构建。 其中暴力法适合数据较小的方式，否则效率会比较低。如果数据量比较大一般会选择用 KD 树构建 KNN 模型，而当 KD 树也比较慢的时候，则可以试试球树来构建 KNN。参数选项如下：
   • 'brute' ：蛮力实现
   	• 'kd_tree'：KD 树实现 KNN
   	• 'ball_tree'：球树实现 KNN 
   	• 'auto'： 默认参数，自动选择合适的方法构建模型
   不过当数据较小或比较稀疏时，无论选择哪个最后都会使用 'brute'
 
 - leaf_size：如果是选择蛮力实现，那么这个值是可以忽略的，当使用KD树或球树，它就是是停止建子树的叶子节点数量的阈值。默认30，但如果数据量增多这个参数需要增大，否则速度过慢不说，还容易过拟合。
 - p：和metric结合使用的，当metric参数是"minkowski"的时候，p=1为曼哈顿距离， p=2为欧式距离。默认为p=2。
 - metric：指定距离度量方法，一般都是使用欧式距离。
   • 'euclidean' ：欧式距离
   	• 'manhattan'：曼哈顿距离
   	• 'chebyshev'：切比雪夫距离
   	• 'minkowski'： 闵可夫斯基距离，默认参数
 - n_jobs：指定多少个CPU进行运算，默认是-1，也就是全部都算。

2、算法实现

以乳腺癌为例，在使用KNN算法之前，我们要先决定K的值是多少，要选出最优的K值，可以使用sklearn中的交叉验证方法，代码如下：

from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import cross_val_score
import matplotlib.pyplot as plt
from sklearn.neighbors import KNeighborsClassifier
load_breast_cancer = load_breast_cancer()
x = load_breast_cancer.data
y = load_breast_cancer.target
k_error = []
for k in range(1,31):
    knn = KNeighborsClassifier(n_neighbors=k)
    scores = cross_val_score(knn,

最低0.47元/天解锁文章

Predilection...

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
KNN算法实现

KNN算法实现一、用KNN将分类好的数据1、算法概述KNN算法2、各参数的实际意义 def KNeighborsClassifier(n_neighbors = 5, weights='uniform', algorithm = '', leaf_size = '30', p = 2,
复制链接

扫一扫

专栏目录