根据挖掘目标和数据形式可以建立分类与预测、聚类分析、关联规则、时序模式、偏差检测。
算法名称 | 算法描述 |
---|---|
回归分析 | 确定预测属性与其他变量间相互依赖的定量关系最常用的统计学方法 |
决策树 | 自顶向下的递归方式,在内部节点进行属性值的比较,并根据不同的属性值从该节点下分支,最终得到的叶节点是学习划分的类 |
人工神经网络 | 输入与输出之间关系的模型 |
贝叶斯网络 | 不确定知识表达和推理领域最有效的理论模型之一 |
支持向量机 | 把低维的非线性可分转化为高维的线性可分,在高维空间进行线性分析的算法 |
主要回归模型
回归模型名称 | 算法描述 |
---|---|
线性回归 | 对一个或多个自变量和因变量之间的线性关系进行建模,可用最小二乘法求解模型系数 |
非线性回归 | 对一个或多个自变量和因变量之间的非线性关系进行建模。如果非线性关系可以通过简单的函数变换转化成线性关系,用线性回归的思想求解;不过不能转化,用非线性最小二乘法求解 |
Logistic回归 | 广义线性回归模型的特例,利用Logistic函数将因变量的取值范围控制在0和1之间,表示取值为1的概率 |
岭回归 | 一种改进最小二乘估计的方法 |
主成分回归 | 主成分回归是根据主成分分析的思路提出来的,是对最小二乘法的一种改进,它是参数估 |