常用聚类算法

朴素贝叶斯(Naive Bayes, NB)

Logistic回归(Logistic Regression, LR)

决策树(Decision Tree, DT) 

支持向量机(Support Vector Machine, SVM)

LR算法

FM算法:FM主要用SVDFeature;

随机森林(Random Forest, RF)

GBDT算法,

SVD算法

hac算法

Canopy算法

kmeans

层次聚类算法:分为凝聚的层次聚类算法和分裂的层次聚类算法。

SOM聚类算法(Self Organizing Maps)

FCM聚类算法

EM聚类:EM(Expectatioin-Maximalization)算法 即期望最大算法

MClust

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)

CHAMELEON

BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
聚类算法是一种将数据划分为不同组的无监督学习算法常用聚类算法可以分为单聚类算法和双聚类算法两类。 一、单聚类算法聚类算法是指将数据分为多个簇,每个簇只包含一个数据点的算法常用的单聚类算法有以下几种: 1. K-Means算法 K-Means算法是一种基于距离的聚类算法,它将数据集分为K个簇,使得同一簇内的数据对象相似度较高,而不同簇之间的相似度较低。它的基本思想是:先随机选择K个中心点,然后将每个样本点分配到距离其最近的中心点所在的簇中,再更新每个簇的中心点,重复以上步骤直到收敛。 2. 层次聚类算法 层次聚类算法是一种自底向上或自顶向下的聚类算法,它将数据集中的每个数据点视为一个初始簇,然后根据相似度逐步合并簇,直到达到预设的簇个数或者满足某个条件为止。常用的层次聚类算法包括:自底向上的聚合聚类算法(AGNES)和自顶向下的分裂聚类算法(DIANA)。 3. DBSCAN算法 DBSCAN算法是一种基于密度的聚类算法,它将数据点分为核心点、边界点和噪声点三类,通过控制一个邻域半径和一个最小点数来定义密度。核心点是在其邻域内包含大于等于最小点数的点的点,边界点是在其邻域内包含小于最小点数的点,但是它本身是核心点的点,噪声点是既不是核心点也不是边界点的点。 二、双聚类算法聚类算法是指将数据同时分为多个簇,每个簇不仅可以包含一个数据点,还可以包含多个数据点的算法常用的双聚类算法有以下几种: 1. 非负矩阵分解(NMF) NMF算法是一种基于矩阵分解的双聚类算法,它将原始数据矩阵分解为两个非负矩阵,分别表示样本和特征的隐含簇。NMF算法的优点是可以发现数据中的隐含结构,可以应用于文本挖掘、图像处理等领域。 2. 谱聚类算法聚类算法是一种基于图论的聚类算法,它将数据点看作是图中的节点,根据节点之间的相似度构建图,并将聚类问题转化为一个图划分问题。谱聚类算法的优点是可以发现数据中的非线性结构,可以应用于图像分割、社交网络分析等领域。 3. 双聚类算法聚类算法是一种同时对行和列进行聚类算法,它生成的聚类结果是一个行簇和一个列簇的交叉矩阵。双聚类算法的优点是可以同时发现行和列之间的关系,可以应用于基因表达数据分析、文本挖掘等领域。 总之,不同的聚类算法适用于不同的数据类型和应用场景,应根据具体情况选择合适的聚类算法进行分析和处理。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值