机器学习 复习四 聚类

无监督学习
衡量:处理不规则形状,噪音点

相似的物品成一类,不相似的物品不成一类

K-Means

步骤:
随机选K个聚集点
每个数据被赋值最近聚集点类别
使用每个聚集中心点更新
重复直到聚点不再移动
返回K个中心点坐标

优点:简单,对于规则性图形聚类很好,收敛性号 O(t k n)
缺点:定K值,可能收敛到局部最优,噪音点影响大

Sequential Leader Clustering

特点:不需要K 不需要迭代
一个点一个点扫描,计算新的数据和每个类重心,如果最小距离小于选择边界,则重新为一个类

期望最大法

用模型预计
高斯混合模型
在这里插入图片描述
EM算法(贝叶斯公式)
在这里插入图片描述隐含参数

在这里插入图片描述

密度与层次

密度聚类:
Density Base Methods
DBSCAN
核心点,边缘点,噪音点
根据连通性
簇,从核心点膨胀,一个点一个点加入,删除噪音点

层次聚类:(距离选择,最大距离,最小距离等)
从底到上聚类,迭代,合并,知道所有样本聚层一个类
例题:城市距离聚类

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值