K-means 和 K-medoids算法聚类分析

本文介绍了聚类分析的基本概念、特点和应用,并详细讲解了两种常见的聚类算法——K-means和K-medoids。K-means算法通过迭代优化簇的均值,而K-medoids算法选择簇内的对象作为代表点,对孤立点和噪声数据的鲁棒性更强。这两种算法广泛应用于数据挖掘、市场分析、医学诊断等多个领域。
摘要由CSDN通过智能技术生成

 1    聚类是对物理的或者抽象的对象集合分组的过程,聚类生成的组称为簇,而簇是数据对象的集合。

        (1)簇内部的任意两个对象之间具有较高的相似度。(2)属于不同的簇的两个对象间具有较高的相异度。

 2    相异度可以根据描述对象的属性值来计算,最常用的度量指标是距离。

 3   聚类最初来自数学,统计学,和数值分析;机器学习领域把聚类描述成隐含模式,发现簇的过程是无监督学习;聚类是模式识别的重要手段。

 4    聚类的特点:用少量的簇来描述大量数据的特征:  数据简洁,丢失精细部分

 5   聚类数据挖掘实践中的应用

   (1) 数据预处理  (2) 科学数据探索 (3) 信息获取与文本挖掘  (4)  空间数据库应用 

   (5) 客户关系管理 (6) 市场分析  (7)  Web分析  (8)  医学诊断  (9)计算生物学。

6   统计学 :  聚类分析是通过数据建模简化数据的一种方法:包括  系统聚类法,分解法,加入法,动态聚类法。有序样品聚类,有重叠聚类和模糊聚类等

7   机器学习:簇  相当于隐藏模式。聚类是搜索簇的无监督学习的过程

      与 分类不同。无监督学习不依赖预先定义的类或者带类标记的训练实例。需要有聚类学习算法自动确定标记。而分类学习

的实例或数据对象有类别标记。聚类是观察试学习,而不是实例式学习。

8   实际应用:聚类分析是数据挖掘的主要任务之一

    (1) 作为一个独立的工具获得数据的分布状况。观察每一个簇数据的特征,集中对特定的簇集合作进一步地分析。

     (2) 作为其他数据挖掘任务(如分类,关联规则)的预处理步骤

9   聚类算法的特征:

    (1)处理不同类型属性的能力;

    (2) 对大型数据集的可扩展性;
    (3) 处理高维数据的能力;
    (4) 发现任意形状簇的能力;
    (5) 处理孤立点或“噪声”数据的能力;
             对“噪声”数据具有较低的敏感性;
             合理地发现孤立点。
    (6) 对数据顺序的不敏感性;
    (7) 对先验知识和用户自定义参数的依赖性;
    (8) 聚类结果的可解释性和实用性;
    (9) 基于约束的聚类。

10  聚类算法分类:

    (1)  基于划分的方法:  K-means 算法    基于密度的算法

   (2) 基于层次的方法 :  凝聚算法  分裂算法

   (3) 基于网络的 方法

   (4) 非数据与数据属性同时出现的方法

    (5)基于约束的方法

   (6) 运用机器学习技术的方法  :梯度下降法  人工神经网络   进化模型

    (7) 有扩展性的算法

    (8) 面向高维数据集的算法

10   数据类型

     (1)区间标度型:用线性标度描述的连续度量  (如  高度   重量 经纬度坐标 温度等)

     (2)  布尔类型 : 如果两个状态同等重要,称为对称的  否则是不对称的

     (3)  标称型: 有若干个离散的取值

     (4) 序数型:  取离散的序数值,序列排序是有意义的

     (5) 比例标度型:在非线性标度上取正的度量值。

11  数据结构   

                                      数据矩阵                                                                                                                                   相异度矩阵

  • 20
    点赞
  • 134
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值