数据挖掘十大经典算法----简介

一、C4.5

机器学习算法中的一个分类决策树(Decision Tree)算法,它是决策树核心算法ID3的改进算法。

二、K-Means

The k-means algorithm,聚类算法,将对象根据属性分为K类,进行分割。

与处理混合正态分布的最大期望算法很相似,因为他们都试图找到数据中自然聚类的中心。

三、SVM

支持向量机(support vector machines),简称SV机。一种有监督学习算法,应用于统计分类以及回归分析中。       

四、Apriori

Apriori算法是一种挖掘布尔关联规则频繁项集的算法。

核心是基于两段频集思想的递归算法。该关联规则在分类上属于单维、单层、布尔关联规则。

五、EM

最大期望算法(Expectation-Maximization,EM),在概率模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量。

通常用于机器学习和计算机视觉的数据集聚(data clustering)领域。

六、PageRank

page指算法创始人(larry page)。

PageRank根据网站的外部链接和内部链接的数量和质量衡量网站的价值。

核心概念是:每个到页面的链接都是对该页面的依次投票,被链接的越多,就意味着被其他网站投票越多。

七、AdaBoost

一种迭代算法。

核心思想是针对同一训练集训练不同的分类器(弱分类器),然后将这些弱分离器组合起来,构成一个更强的最终分类器(强分类器)。

八、KNN

k最近邻(k-nearest neighbor,KNN)分类算法。

算法思想:如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。

九、Naive Bayes

朴素贝叶斯(Naive Bayesian Model,NBC)模型,是应用最广泛的两种分类模型之一(决策树模型和朴素贝叶斯模型)。

十、CART

分类与回归树,(Classification and Regression Trees,CART)。

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值