（一）预测模型之统计预测

青冥猪猪

已于 2022-06-07 17:56:33 修改

阅读量3k

点赞数 1

分类专栏：数学文章标签：矩阵机器学习线性代数概率论

于 2022-06-07 17:30:05 首次发布

本文链接：https://blog.csdn.net/VV1212_662/article/details/125169303

版权

数学专栏收录该内容

6 篇文章 3 订阅

订阅专栏

我们在做多元回归进行预测时，其所给出的数据往往是多变量的，而且自变量之间不能够存在多重共线的问题，另外样本数据的残差需要服从正态分布。

数据预处理

1、描述性统计

	变量1	变量2	变量3
样本1
样本2
样本3

假设用i=1,2,...,n 表示不同的样本点，表示j=1,2...,m不同的变量，第 i个样本的第j 个变量取值为 aij，有：

2、数据无量纲处理

模型的建立

1、多元线性回归分析模型

2、多项式回归分析

回归模型作为一种古老的预测模型，随着时间的发展，其衍生出多种模型预测，对于那些波动起伏的数据需要引入非线性回归模型，而多项式回归模型最为合适不过。在多项式的回归中，加入特征的高次方，相当于增加模型的自由度，以达到获取数据的非线性变化[3][4]。

多项式主要通过历史数据的拟合出多项式回归的方程，并用多项式回归的方程对新的数据进行预测，其回归方程如下：

3、逐步多元回归

模型的求解

Matlab、python

模型的显著性检验

1、拟合优度的检验

构建的回归方程，若误差项的影响占越低，则自变量的影响占比越高，拟合方程预测效果越好。由回归方程描绘的曲线与各变量的接近程度成为回归方程对数据集的拟合优度，而评判曲线拟合优度需要一些指标，其中一个就是判定系数。

其中，SSE为误差平方和，SSR为回归离差平方和，SST为总的离差平方和。

多元线性回归方程的拟合优度，即有：

2、F检验（对整体回归方程的显著性检验）

实质：通常用来分析用了超过一个参数的统计模型，以判断该模型中的全部或一部分参数是否适合用来估计母体。

F检验假设：

3、T检验（对单个变量系数的显著性检验）

实质：主要用于样本含量较小（例如n<30），总体标准差σ未知的正态分布。t检验是用t分布理论来推论差异发生的概率，从而比较两个平均数的差异是否显著。

T检验有多种类型，可以分为只有一组样本的单体检验和有两组样本的双体检验。单体检验用于检验样本的分布期望是否等于某个值。双体检验用于检验两组样本的分布期望是否相等，又分为配对双体检验和非配对双体检验。配对双体检验的两组样本数据是一一对应的，而非配对双体检验的两组数据则是独立的。以下只介绍单样本T检验，即有：