KNN 和 K-Means算法比较
- | K-Means | KNN |
---|---|---|
学习策略 | 无监督学习 | 监督学习 |
功能 | 用于聚类 | 用于分类和回归 |
k的含义 | “K”是算法聚类的类别数 | 特征空间中k个最邻近的样本中大多数属于某一类别,则该样本就属于某一类别 |
应用 | 通常用于人口统计学,市场细分,社交媒体等 | 已知数据的分类和回归 |
算法步骤 | 1)任意选择k个观测值,向量空间中的每个点都分配给最近质心 形成k类。2)更新质心为每个类别的平均值,并且重新将空间中的点分配个最近的质心。3)重复直到质心不再变化或者在一定阈值范围内停止(当然也可以设定迭代次数)否则重复步骤2 | 1)计算测试数据与各个训练数据之间的距离,选取距离最小的k个点。2)确定前k个点所在类别的出现频率。3)返回前k个点中出现频率最高的类别作为测试数据的分类。 |