K-Means聚类算法,感觉是接触到目前为止,距离程序员思维最近的算法,应该也是使用到的数理知识最简单的算法。
所以在记笔记的时候,忍不住,又去实现了一把,但是根据吴大大(吴恩达)的介绍来看,的确是不需要每个算法都自己去写的,而是需要了解的算法的本质、知道算法适用的场景,多加练习,才能达到熟能生巧的程度。
符号“o”表示数据点。符号“x”表示我们需要寻找的中心点。
主要思路描述:
1、在所有的点中随机选择K点(也就是中心点),详见函数中的getRandom(我在函数中增加了K点不重复的逻辑,如果重复的话,结果就变成K-1个点了);
2、计算每个x点到第K个点的距离,假设我们x(i),x有i个点;K(k),K中心点有k个点;我们将x(i)分析给到第K个点距离最短的那个K点。也就是归属到哪个K点的势力范围;
3、我们计算每个K点的势力范围下面的x(i)的点,并计算在该势力范围的中位点。并将K点移动到对位的中位点。
然后再重复2、3步骤,直到最终K点不再移动。
注:图片借用网友的图(原文章地址:
[聚类算法]聚类算法中的K-Means实现以及验证
最新推荐文章于 2024-02-03 10:30:00 发布
本文介绍了K-Means聚类算法的简单实现过程,包括随机选择中心点、计算点到中心点的距离并分配类别,以及如何通过迭代找到最优解。文中还强调理解算法本质和应用场景的重要性,通过示例展示了多次执行以获得满意分类结果的必要性。
摘要由CSDN通过智能技术生成