数据挖掘的十大算法
按照不同的目的将算法分成四类
分类算法: C4.5 ,朴素贝叶斯,SVM,KNN ,Adaboost , CART
聚类算法: K-Means , EM
关联分析:Apriori
连接分析:PageRank
1.C4.5
C4.5 算法是十大算法之首,它是决策树的算法,它在决策树够早过程中就进行了剪枝处理,并且可以处理连续的属性,也能对不完整的数据进行处理。
2.朴素贝叶斯算法
朴素贝叶斯模型是基于概率论的原理,原理:对于给出的未知物体想要进行分类,就需要求解这个未知物体出现的条件下各个类别出现的概率,哪个最大,就认为未知物体属于哪个分类
3.SVM
SVM 也叫支持向量机,SVM在训练中建立了一个超平面的分类模型
4.KNN
KNN也叫k 最近邻算法。所谓k近邻,就是每个样本都可以用它最近接的k个邻居来代表。如果一个样本,它的k个最接近的邻居都属于分类A,那么这个样本也属于分类A。
5.Adaboost
.Adaboost 是在训练中建立了一个联合的分类模型。boost是代表提升的意思,所以.Adaboost 是构建分类器的算法。他可以让我们多个弱的分类器组合成