数据挖掘十大算法:
C4.5决策树、K-均值(K-mean)、支持向量机(SVM)、Apriori、最大期望算法(EM)、PageRank算法、AdaBoost算法、k-近邻算法(KNN)、朴素贝叶斯算法(NB)、分类回归树(CART)算法。
监督学习包括分类和回归预测问题,目标变量有两种类型:标称型和数值型。
第一部分:分类
1. K-近邻算法
2. 决策树(ID3算法)
3.朴素贝叶斯(基于概率论)
4.Logistic回归
5.支持向量机SVM
6.AdaBoost算法
7.决策树(C4.5)
第二部分:利用回归预测数值型数据
1. 线性回归
2. 局部加权线性回归
3.岭回归
4.lasso回归
5.前向逐步回归
6.分类回归树(CART算法)(决策树)
第三部分:无监督学习算法
1. K-均值聚类算法
2.Apriori算法
3.FP-growth算法
第四部分:其他工具
1. PCA:简化数据,降维
2. SVD:简化数据
3. 大数据与MapReduce
4.Hadoop