#分类与预测: # 分类:是一个构造分类模型,输入样本的属性值,输出对应的类别,将每个样本映射到先定义好的类别;分类模型建立在已有类标记的数据集上,模型在已有样本上的准确率可以方便计算。 # 分类两步:第一步是学习步,通过归纳分析训练样本集哎加你分诶模型得到分类规则;第二步是分类不,先用一直的测试样本集评估分类规则的准确率,如果准确率可以接受,则使用该模型对未知类标号的待测样本集进行预测。 # 预测:是指建立两种或梁总以上变量间相互依赖的函数模型,然后进行预测或控制。 # 预测两步:第一步是通过训练集建立预测属性的函数模型,第二步在模型通过检验后进行预测或控制。 # 常用的分类与回归算法: # 1、回归分析:通过加你模型来研究变量之间相互关系的密切程度,结构状态及进行模型预测的一种有效工具。回归分析研究内容包括: # 线性回归(一元线性回归,多元线性回归,多个自变量与多个因变量的回归); # 回归诊断(如何从数据推断回归模型基本假设的合理性,基本假设不成立时如何对数据进行修正,判断回归方程拟合的效果,选择回归函数的形式) # 回归变量选择(自变量选择的标准,逐步回归分析法) # 参数估计方法改进(偏最小二乘回归,岭回归,主成分回归) #