读书笔记-《机器学习》第九章:聚类

  • 在“无监督学习”中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据内在性质及规律,为进一步的数据分析提供基础
  • 聚类过程仅能自动形成簇结构,簇所对应的概念语义需由使用者来把握和命名
  • 聚类既能作为一个单独过程,用于寻找数据内在的分布结构,也可作为分类等其他学习任务的前驱过程
  • 聚类性能度量
    • 外部指标
      • Jaccard系数
      • FM指数
      • Rand指数
    • 内部指标
      • BD指数
      • Dunn指数
  • 距离计算
    • 闵可夫斯基距离:有序属性
    • VDM距离:无序属性
  • 原型聚类
    • K均值算法
    • 学习向量量化
    • 高斯混合聚类
  • 密度聚类
    • DBSCAN
  • 层次聚类
    • AGNES
  • k均值算法可看作高斯混合聚类在混合成分方差相等,且每个样本仅指派给一个混合成分时的特例
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值