机器学习之Kmeans

本文介绍了聚类方法,特别是KMeans算法。聚类是非监督学习的一种,目标是找到数据内在的结构。KMeans是一种基于距离计算的无监督聚类算法,通过迭代更新质心来划分数据。文章讨论了性能度量、距离计算方法,并提到了簇间和簇内的度量标准。此外,还提及了分级聚类和层次聚类的概念。
摘要由CSDN通过智能技术生成

聚类

非监督学习,输入的数据没有标签,通过学习找出数据内在的性质和规律。
两个基本问题来衡量聚类效果的好坏:

性能度量

最佳的效果是簇内相似度高,簇间相似度低(类似高内聚低耦合)

  • 簇间度量(越大越好)

    • Jrccard系数
    • FM系数
    • Rand系数
  • 簇内度量

    • DB系数(越小越好)
    • Dumn系数(越大越好)

距离计算

有序属性
  • 闵可夫斯基距离
    这里写图片描述
  • 曼哈顿距离
    是闵可夫斯基距离参数=1 的情况
    这里写图片描述
  • 欧氏距离
    是闵可夫斯基距离参数=2 的情况
    这里写图片描述
无序属性

Kmeans算法

综述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值