机器学习——KNN

最新推荐文章于 2024-05-13 19:08:39 发布

李大黑太白

最新推荐文章于 2024-05-13 19:08:39 发布

阅读量1k

点赞数

分类专栏：人脸识别学习笔记

本文链接：https://blog.csdn.net/weixin_43842155/article/details/115532379

版权

人脸识别学习笔记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

KNN(k-近邻算法）

KNN是机器学习中的一种分类算法，顾名思义，KNN是通过将样本映射为欧式空间中的坐标，将测试样本与周边的k个数据集样本比较，如果k个样本中的大部分属于一类，则就可以预测该测试样本属于该类。
KNN一般通过计算样本之间的欧氏距离寻找k个邻近点。
欧式距离

距离度量

KNN算法通过对样本坐标之间的距离来衡量样本之间的相似程度，距离越近，相似程度越高。

k值的选择

k值的选择会对kNN模型的结果产生重大影响。选择较大的k值，相当于用较大邻域中的训练实例进行预测，模型会考虑过多的邻近点实例点，甚至会考虑到大量已经对预测结果没有影响的实例点，会让预测出错；选择较小的k值，相当于用较小邻域中的训练实例进行预测，会使模型变得敏感（如果邻近的实例点恰巧是噪声，预测就会出错）。
在应用中，k值一般取一个比较小的数值。通常采用交叉验证法来选取最优的k值。

sklearn中的KNN

from sklearn import neighbors
model = neighbors()
'''
    @param n_neighbors: 指定kNN的k值
    @param weights:  
    'uniform': 本节点的所有邻居节点的投票权重都相等
    'distance': 本节点的所有邻居节点的投票权重与距离成反比
    @param algorithm:  惩罚项系数的倒数，越大，正则化项越小
    'ball_tree': BallTree算法
    'kd_tree': kd树算法
    'brute': 暴力搜索算法
    'auto': 自动决定适合的算法
    @param leaf_size:  指定ball_tree或kd_tree的叶节点规模。他影响树的构建和查询速度
    @param p:  p=1:曼哈顿距离; p=2:欧式距离
    @param metric:  指定距离度量，默认为'minkowski'距离
    @param n_jobs: 任务并行时指定使用的CPU数，-1表示使用所有可用的CPU

    @method fit(X,y): 训练模型
    @method predict(X): 预测
    @method score(X,y): 计算在(X,y)上的预测的准确率
    @method predict_proba(X): 返回X预测为各类别的概率
    @method kneighbors(X, n_neighbors, return_distance): 返回样本点的k近邻点。如果return_distance=True，则也会返回这些点的距离
    @method kneighbors_graph(X, n_neighbors, mode): 返回样本点的连接图

李大黑太白

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
机器学习——KNN

KNN(k-近邻算法）KNN是机器学习中的一种分类算法，顾名思义，KNN是通过将样本映射为欧式空间中的坐标，将测试样本与周边的k个数据集样本比较，如果k个样本中的大部分属于一类，则就可以预测该测试样本属于该类。KNN一般通过计算样本之间的欧氏距离寻找k个邻近点。距离度量KNN算法通过对样本坐标之间的距离来衡量样本之间的相似程度，距离越近，相似程度越高。k值的选择k值的选择会对kNN模型的结果产生重大影响。选择较大的k值，相当于用较大邻域中的训练实例进行预测，模型会考虑过多的邻近点实例点，甚至会
复制链接

扫一扫