一、分类
分类:输入样本数据,输出对应的类别,将样本中每个数据对应一个已知属性。(有监督学习)
分类算法分为两步:
(1)学习步:通过训练样本数据集,建立分类规则
(2)分类步:用已知的测试样本集评估分类规则的准确率,若准确率可接受,则是使用该规则对除样本以外的数据(待测样本集)进行预测。
二、预测
预测:两种或者两种以上的变量之间相互依赖的函数模型,进行预测或者控制。
预测算法分两步:
(1)通过训练集建立样本模型
(2)通过检验后进行预测或者控制
三、常用的分类与预测算法
1.回归分析:线形回归、非线性回归、Logistic回归、岭回归、主成分回归、最小二乘回归等。
2.决策树:分类算法
3.ANN(人工神经网络):
4.贝叶斯网络
5、支持向量机(svm):将低维非线性转换为高维线形进行计算。