机器学习(Machine learning)9——K-means algorithm(k-means聚类算法)

一、Application of clustering

Market segmenation; Social network analysis; Organize computing clusters; Astronomical dada analysis.

It’s an unsupervised learning.

二、K-means algorithm

为了更好的理解此算法,我们先来举一个例子:

  1. 首先给定一组数据样本点
    在这里插入图片描述

  2. 随机初始化两个样本点作为两个簇的中心点
    在这里插入图片描述

  3. clustering assignment(进行簇的分类)
    在这里插入图片描述

  4. move centroid(移动中心点:形成两个簇的新的中心点)

    a. 找出所有红色的点,计算出他们的均值,然后把红点的聚类中心移动到这里。

    b. 找出所有蓝色的点,计算出他们的均值,然后把蓝点的聚类中心移动到这里。
    在这里插入图片描述

  5. 重新进行簇的分类
    在这里插入图片描述

  6. 移动中心点:形成两个簇的新的中心点
    在这里插入图片描述

  7. 再重新进行簇的分类
    在这里插入图片描述

  8. 再移动中心点:形成两个簇的新的中心点
    在这里插入图片描述
    到这一步,分类完成。

三、K-means algorithm step

在这里插入图片描述

四. K-means optimization objective

在这里插入图片描述
2. Optimization objective:
在这里插入图片描述
在这里插入图片描述

五. 注意事项

  1. 刚开始时改如何初始化聚类中心?

    a. 首先要求聚类中心数<样本数m。
    b. Randomly pick K training examples:         
    

在这里插入图片描述
2. 如何选择聚类的数量(即K的值):

目前都是通过人们手动选取或者根据人们的经验来选,最重要的是选择聚类的数量来更好的服务我们的目的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值