1、贝叶斯分类器 Bayes Classifier
核心:将样本判定为后验概率最大的类。
2、决策树 Decision Trees
核心:一组嵌套的判定规则。
3、kNN 算法
核心:模板匹配,将样本分到离它最相似的样本所属的类。
4、主成分分析 PCA
核心:向重构误差最小(方差最大)的方向做线性投影。
5、线性判别分析 -- Linear Discrimination Analysis(LDA)
核心:向最大化类间差异、最小化类内差异的方向线性投影。
6、局部线性插入(流形学习)-- Locally Linear Embedding(LLE)
核心:用一个样本点的邻居的线性组合近似重构这个样本,将样本投影到低维空间中后依然保持这种线性组合关系。
7、等距映射(流形学习)-- Isometric mapping(Isomap)
核心:将样本投影到低维空间之后依然保持相对距离关系。
8、人工神经网络 ANN
核心:一个多层的复合函数。
9、支持向量机 SVM
核心:最大化分类间隔的线性分类器(不考虑核函数)。
10、逻辑回归 Logistic Regression
核心:直接从样本估计出它属于正负样本的概率。
11、随机森林 Random Forest
核心:用有放回采样的样本训练多棵决策树,训练决策树的每个节点是只用了无放回抽样的部分特征,预测时用这些树的预测结果进行投票。
12、AdaBoost 算法
核心:用多个分类器的线性组合来预测,训练时重点关注错分的样本,准确率高的弱分类器权重大。
13、卷积神经网络 CNN
核心:一个共享权重的多层复合函数。
14、循环神经网络 RNN
核心:综合了复合函数和递推数列的一个函数。
15、K均值算法 K-means
核心:把样本分配到离它最近的类中心所属的类,类中心由属于这个类的所有样本确定