硕士读了快一年了一直专注于系统开发方向,尤其是分布式和数据库这一块,身边其他很多同僚都是数据挖掘这个方向,耳濡目染,最近学习了数据挖掘的相关内容,突然觉得还是蛮有意思的东西,在这里对数据挖掘领域的相关经典算法做一个综述,日后一一详解。
一、分类算法
#1. C4.5
#2. CART(Classification and Regression Tree)分类和回归树
#3. K Nearest N'ei'ghbours(KNN)K近邻
#4. Naive Bayes 朴素贝叶斯
二、统计学习
#5. SVM(Support Vector Machine) 支持向量机
#6. EM(Expectation Maximization) 最大期望
三、关联分析
#7. Apriori
#8. FP-Tree(Frequent Pattern Tree) 频繁模式树
四、链接挖掘
#9. PageRank
#10. HITS
五、聚类
#11. K-Means
#12. BIRCH
六、Bagging and Boosting
#13. Adaboost
七、Sequential Pattern(序列模式)
#14. GSP(generalized sequential pattern)
#15. PrefixSpan
八、完整性挖掘
#16. CBA(Classification Based on Association)关联分类
九、粗糙集
#17. Finding Reduct (知识约简)
十、图挖掘
#18. gSpan(频繁子图挖掘)