文章目录
一、Application of clustering
Market segmenation; Social network analysis; Organize computing clusters; Astronomical dada analysis.
It’s an unsupervised learning.
二、K-means algorithm
为了更好的理解此算法,我们先来举一个例子:
-
首先给定一组数据样本点
-
随机初始化两个样本点作为两个簇的中心点
-
clustering assignment(进行簇的分类)
-
move centroid(移动中心点:形成两个簇的新的中心点)
a. 找出所有红色的点,计算出他们的均值,然后把红点的聚类中心移动到这里。
b. 找出所有蓝色的点,计算出他们的均值,然后把蓝点的聚类中心移动到这里。
-
重新进行簇的分类
-
移动中心点:形成两个簇的新的中心点
-
再重新进行簇的分类
-
再移动中心点:形成两个簇的新的中心点
到这一步,分类完成。
三、K-means algorithm step
四. K-means optimization objective
2. Optimization objective:
五. 注意事项
-
刚开始时改如何初始化聚类中心?
a. 首先要求聚类中心数<样本数m。 b. Randomly pick K training examples:
2. 如何选择聚类的数量(即K的值):
目前都是通过人们手动选取或者根据人们的经验来选,最重要的是选择聚类的数量来更好的服务我们的目的。