2009年,Wu Xindong 出版的一本书名叫:The Top Ten Algorithms in Data Mining,里面有关于算法的介绍
一、C4.5,分类决策树算法
二、The k-means algorithm 即K-Means算法,聚类算法
三、 Support vector machines 支持向量机,广泛的应用于统计分类以及回归分析中
四、The Apriori algorithm 挖掘布尔关联规则频繁项集的算法
五、最大期望(EM)算法,在概率(probabilistic)模型中寻找参数最大似然估计的算法
六、 PageRank,根据网站的外部链接和内部链接的数量和质量,衡量网站的价值
七、AdaBoost,针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器 (强分类器)
八、 kNN: k-nearest neighbor classification,分类算法
九、 Naive Bayes,在众多的分类模型中,应用最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型
十、CART: 分类与回归树
数据源网址:http://www.cs.uvm.edu/~icdm/algorithms/index.shtml