4.8聚类

聚类


1.表示聚类结果的方法

1.一个实例可以落入一个组
2.一个实例可以落入多个组
3.一个实例可以部分分到其他组(概率)

2.基于距离

1.代表
K-means

2.k-means改进
动机一:速度慢

  • 将数据集投影,按照选定的轴进行分裂,来取代由选择最近的聚类中心所意味着使用的任意超平面分裂法。该方法会由于降维破坏数据

  • Kd树/球树(有效)
    Q:做法
    A:
    创建一个kd树/球树,在聚类过程中保持不变。
    每一次K均值迭代过程中产生一组聚类中心,所有数据点分配到最近的聚类中心
    从树向下寻找叶节点,分别检查叶节点上的每一个点,从而寻找聚类中心。如果较高位置的内部结 点 的区域完全落入了某个单独的聚类中心范围内,聚类计算总值得到更新。否则,向下搜索。

Q:如何获得中心?
A:跟K-means一样

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值