主题 | 数据建模
我还是一次性将一些理论的知识整理完呗,大家可以选择性地看看就好,后续会找一些实例来练练。
一、分类与预测
分类与预测是预测问题的2种主要实现类型。分类指的是预测分类情况(离散属性),而预测则是建立连续值函数模型,预测给定自变量对应的因变量的值。
1. 常用预测与分类算法
1)回归分析
确定预测属性(数值型)与其他变量间相互依赖的定量关系最常用的统计学方法,包括线性回归、非线性回归、logistic回归、岭回归、主成分回归、偏最小二乘回归。
2)决策树
决策树采用自顶而下的递归方式,在内部节点进行属性值的比较,并根据不同的属性值从该节点向下分支,最终得到的叶节点是学习划分的类。
3)人工神经网络
指的是一种模仿大脑神经网络结构和功能而建立的信息处理系统,表示神经网络的输入与输出之间关系的模型。
4)贝叶斯网络