机器学习——深入理解K-means,KNN算法的区别

本文深入探讨了K-means聚类算法,包括算法简介、思想、描述及一个药物分类的例子。K-means算法适用于数据簇形状为凸面、大小相近的情况,但也存在对初始聚类中心敏感、局部最优和对噪声敏感的问题。同时,文章提到了KNN算法,这是一种基于最近邻的分类方法,依赖于数据统计,属于懒学习。KNN与K-means的主要区别在于KNN是分类而非聚类,且不需要预先确定类别数量。
摘要由CSDN通过智能技术生成

K-means方法是一种非监督学习的算法,它解决的是聚类问题。

1、算法简介:K-means方法是聚类中的经典算法,数据挖掘十大经典算法之一;算法接受参数k,然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足聚类中的对象相似度较高,而不同聚类中的对象相似度较小。

2、算法思想:以空间中k个点为中心进行聚类,对最靠近他们的对象归类,通过迭代的方法,逐次更新各聚类中心的值,直到得到最好的聚类结果。

3、算法描述:

(1)适当选择c个类的初始中心; 

(2)在第k次迭代中,对任意一个样本,求其到c各中心的距离,将该样本归到距离最短的那个中心所在的类; 

(3)利用均值等方法更新该类的中心值; 

(4)对于所有的C个聚类中心,如果利用(2)(3)的迭代法更新后,值保持不变,则迭代结束;否则继续迭代。

4、算法举例:

我们假设药物A、B、C、D有两个特征值,分别是药物重量以及PH值。

 

 

首先我们把上面的数据画

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值