数仓第十章作业Ⅰ

数仓第十章作业Ⅰ

第五题

设有数据集S={(1,1),(2,1),(1,2),(2,2),(4,3),(5,3),(4,4),(5,4)},令k=3,假设初始簇中心选取为:

①(1,1),(1,2),(2,2); ②(4,3),(5,3),(5,4); ③(1,1),(2,2),(5,3)

试分别用k-平均算法将S划分为k个簇,并对3次聚类结果进行比较分析。

首先,我们使用初始簇中心①(1,1),(1,2),(2,2)进行聚类。

第一次迭代: 计算每个数据点到各个簇中心的距离,并将其归类到距离最近的簇:

  • (1,1) 属于簇1
  • (2,1) 属于簇1
  • (1,2) 属于簇1
  • (2,2) 属于簇3
  • (4,3) 属于簇3
  • (5,3) 属于簇3
  • (4,4) 属于簇3
  • (5,4) 属于簇2

更新簇中心: 计算每个簇的新中心:

  • 簇1的新中心为 (4/3, 4/3)
  • 簇2的新中心为 (5, 4)
  • 簇3的新中心为 (3.67, 3.33)

第二次迭代: 根据新的簇中心,重新计算每个数据点的归属簇:

  • (1,1) 属于簇1
  • (2,1) 属于簇1
  • (1,2) 属于簇1
  • (2,2) 属于簇3
  • (4,3) 属于簇3
  • (5,3) 属于簇3
  • (4,4) 属于簇3
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

-北天-

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值