聚类算法的几个注意点


        聚类算法是一种非监督学习算法,其基本步骤主要分为两步:第一步,根据当前聚类中心对所有样例重新分类;第二步,根据第一步分类的结果重新计算新的聚类中心。思想还是很容易理解的,下面简单说说应用时的几个注意点。


1. 如何初始化聚类中心


       一般,随机从训练样例中随机选取K个样例作为聚类中心。但是当K值很小(2~10)时,很容易陷入局部最优。常见做法是:循环多次(50~1000)进行聚类,从中选择使得目标函数最小的聚类中心。


2. 如何确定聚类的个数


       对于如何选择合适的分类数目,可采用“胳膊肘”法('elbow' method)。所谓的elbow method 其实就是绘制出代价函数与聚类数目K的函数图像,发现图像上有个拐点(形如胳膊肘,因此得名),那么选择拐点所对应的的K值即可。如下图所示:


(图片来源:吴恩达《机器学习》)

        当然,此方法不一定适用于所有应用。如果绘制的图像如右图所示,那么自己看着办吧(结合业务或许可以有个不错的选择)!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值