在挖掘建模之前,必然的需要数据探索和数据预处理,以得到可以直接建模的数据。依据挖掘目标和数据形式,挖掘建模可以分为:分类与预测、聚类分析、关联规则、时序模式、离群点检测等。
分类与预测
分类指的是预测分类标号。预测指的是建立预测的函数来实现给定未来的自变量来得出预测的因变量。
实现过程
先根据训练样本集预设提出分类模型或者预测模型
然后根据测试样本集对提出的分类或预测模型进行准确率测试,如果可以接受,在对其余剩下的值带入得到结果。
常用的分类与预测算法:回归分析、决策树、人工神经网络、贝叶斯网络、支持向量机
回归分析