“数据挖掘十大算法”是IEEE数据挖掘国际会议(ICDM)上的一篇论文,2007年12月在Jonural of Knowledge and Information Systems杂志上发表。根据知识发现和数据挖掘国际会议(KDD)获奖者的问卷调查结果,论文统计除了排名前十的数据挖掘算法。
- C4.5决策树
- K-均值(K-mean)
- 支持向量机(SVM)
- Apriori
- 最大期望算法(EM)
- PageRank算法
- AdaBoost算法
- k-近邻算法(kNN)
- 朴素贝叶斯算法(NB)
- 分类回归树(CART)
生成方法
模型表示了给定输入X产生输出Y的生成关系。先由数据学习联合概率分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测模型,即生成模型:
P(Y