数学建模之聚类模型

数学建模之聚类模型

聚类模型

将文本划分为由类似的对象组成的多个类的过程。在聚类之前,我们并不知道数据都有哪些类型甚至不知道可以分为多少个类型。而分类则是在已知数据类型的前提下,对数据进行划分。聚类之后我们可以用更加准确的统计模型对每个类进行单独估计,分析或预测。

K-means聚类算法

算法流程
  1. 指定需要划分的簇的个数K。 K簇即将数据分为K类。
  2. 随机选择K个数据对象作为初始的聚类中心。不一定要是样本点,可以是与样本点同类型的数据点。
  3. 计算各个数据对象到这K个初始聚类中心的距离,把数据对象划归到距离它最近的那个中心所处在的簇类中。
  4. 调整新类并且重新计算出新类的中心。
  5. 循环步骤三和四,看中心是否收敛,如果收敛或达到次数则停止循环。
  6. 结束

流程图

优缺点

优点

  1. 算法简单、快速
  2. 对处理大数据集,该算法是相对高效的
    缺点
  3. 要求用户必须事先给出要生成的簇的数目K
  4. 对初始值敏感,同样的K,对于不同的初始聚类中心,得到的结果很有可能是不同的。
  5. 对于孤立点数据敏感

K-means++算法

初始的聚类中心之间的相互距离要尽可能远

算法流程
  1. 随机选取一个样本作为第一个聚类中心
  2. 计算每个样本与当前已有聚类中心的最短距离,这个值越大,表示被选取作为聚类中心的概率较大;最后,用轮盘法选出下一个聚类中心。
  3. 重复步骤二,直到选出K个聚类中心。选出初始点后,就继续使用标准的K-means算法。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值