2-1 最近邻规则分类(K-Nearest Neighbor)KNN算法

最新推荐文章于 2024-05-02 08:15:00 发布

蛋子哥

最新推荐文章于 2024-05-02 08:15:00 发布

阅读量2.1k

点赞数 1

分类专栏：机器学习文章标签：算法 KNN 机器学习

本文链接：https://blog.csdn.net/qq_22841811/article/details/53447632

版权

6 篇文章 0 订阅

订阅专栏

最近邻规则分类(K-Nearest Neighbor)KNN算法

未知电影属于什么类型?

假如有三种豆子,我们如何给三个未知豆子分类呢.可以根据离未知豆子比较近的豆子分类

关于距离的衡量方法:

其他距离衡量：余弦值（cos）, 相关度（correlation）, 曼哈顿距离（Manhattan distance）

如图所示K不同时问号可以分别属于绿色蓝色红等类别.

需要大量空间储存所有已知实例
算法复杂度高（需要比较所有已知实例与要分类的实例）
当其样本分布不平衡时，比如其中一类样本过大（实例数量过多）占主导的时候，新的未知实例容易被归类为这个主导样本，因为这类样本实例的数量过大，但这个新的未知实例实际并木接近目标样本,如Y点

注意Y点的

考虑距离，根据距离加上权重
比如: 1/d (d: 距离）

关注

专栏目录