穿越数据迷雾——灰色预测模型-CSDN博客

本文链接：https://blog.csdn.net/qq_57143062/article/details/140755072

文章目录

模型介绍
- 背景与特点
- 适用范围
分析步骤详解
实例
结语
补充

模型介绍

背景与特点

灰色预测是一种在信息不完全、数据不足的情况下进行预测的数学方法。它由邓聚龙教授于1982年提出，以应对复杂系统中的不确定性。灰色预测的特点在于它不需要大量的数据，通过建立模型，对数据进行处理和分析，从而预测未来的趋势。

适用范围

灰色预测广泛应用于经济、气象、资源、社会科学等领域，尤其适合于数据不完整或数据获取成本高昂的情况。它能够帮助决策者在不确定性中寻找规律，为决策提供科学依据。

分析步骤详解

数据序列的生成（原始数据序列）：
假设我们有一组原始数据序列 $x (0) = [x (0) (1), x (0) (2), ..., x (0) (n)]$ ，其中 $n$ )是数据点的数量。
数据的累加生成（1-AGO）：
对原始数据序列进行一次累加生成操作，得到数据序列 $x (1)$ ：
$\sum_{i=1}^{t} x(0)(i)$
其中， $t = 1, 2, ..., n$ 。
数据的微分处理：
对累加生成的数据序列 $x (1)$ 进行微分处理，得到微分序列 $x (1) (t)$ ：
$\Delta x(1)(t) = x(1)(t) - x(1)(t-1)$
其中， $\Delta$ 表示数据的增量。
建立灰色微分方程模型（GM(1)模型）：
假设数据序列 ( x(1) ) 符合一阶线性微分方程：
$\frac{d x(1)(t)}{d t} + ax(1)(t) = b$
其中， $a$ 和 $b$ 是模型参数。
参数的求解：
通过最小二乘法等方法求解模型参数 ( a ) 和 ( b )。首先，将微分方程离散化：
$\Delta x(1)(t) + a x(1)(t-1) = b$
然后，构建设计矩阵 ( B ) 和数据向量 ( Y )：
$\begin{bmatrix} -1 & x(1)(1) \\ -1 & x(1)(2) \\ \vdots & \vdots \\ -1 & x(1)(n-1) \end{bmatrix}, \quad Y = \begin{bmatrix} \Delta x(1)(2) \\ \Delta x(1)(3) \\ \vdots \\ \Delta x(1)(n) \end{bmatrix}$
最后，求解参数 ( a ) 和 ( b )：
$\begin{bmatrix} a \\ b \end{bmatrix} = (B^T B)^{-1} B^T Y$
模型的检验：
通过残差分析等方法检验模型的准确性和适用性。计算残差平方和（RSS）：
$\sum_{t=2}^{n} (\Delta x(1)(t) + a x(1)(t-1) - b)^2$
如果残差平方和较小，说明模型拟合效果较好。
模型的还原：
根据参数 $a$ 和 $b$ ，还原数据序列 $x (0)$ ：
$\frac{b - x(1)(t-1)}{a}$
预测：
利用模型进行未来数据的预测。对于时间 $t = n + 1, n + 2, ...$ ，预测值 $x (0) (t)$ 可以通过以下公式计算：
$\left( x(0)(1) - \frac{b}{a} \right) \cdot (1 - a)^{t-1} + \frac{b}{a}$

实例

假设我们有一组时间序列数据，我们想要预测未来的数据点。以下是使用Python进行灰色预测GM(1)模型的一个简单示例：
以下时间序列数据，表示某地区过去几年的年均降雨量（单位：毫米）：

年份 (t)	降雨量 (x(0))
2015	800
2016	850
2017	900
2018	950
2019	1000

接下来，我们将按照灰色预测的步骤进行操作：
步骤1：数据的累加生成（1-AGO）
累加生成操作后的数据序列 $x (1)$ 如下：

年份 (t)	原始降雨量 (x(0))	累加生成 (x(1))
2015	800	800
2016	850	1650
2017	900	2550
2018	950	3500
2019	1000	4500

步骤2：微分处理
对累加生成的数据序列 $x (1)$ 进行微分处理，得到微分序列 $\Delta x(1)$ ：

年份 (t)	累加生成 (x(1))	微分 (Δx(1))
2016	1650	850
2017	2550	900
2018	3500	950
2019	4500	1000

参数的求解和模型的检验通过下面代码来完成。

import numpy as np
from scipy.linalg import pinv

# 原始数据序列
x0 = np.array([800, 850, 900, 950, 1000])

# 累加生成操作(1-AGO)
def ago(x):
    return np.array([x[i] + x[i-1] for i in range(1, len(x))])

# 灰色预测GM(1)模型参数求解
def grey_model(x0):
    # 累加生成数据
    x1 = ago(x0)
    
    # 构建数据矩阵B
    B = np.vstack([x1[:-1], np.ones(len(x1) - 1)])
    
    # 构建数据向量Y
    Y = x1[1:].reshape(-1, 1)
    
    # 使用最小二乘法求解参数a和b
    X = np.hstack((-B, np.eye(len(x1) - 1)))
    ab = np.linalg.pinv(X.T @ X) @ X.T @ Y
    
    # 预测数据
    predict = [x0[0]]
    for i in range(1, len(x0)):
        predict.append((-ab[0] * predict[-1] + ab[1]) / (1 - ab[0]))
    
    return np.array(predict), ab

# 进行灰色预测
prediction, params = grey_model(x0)

# 打印预测结果和模型参数
print("预测结果:", prediction)
print("模型参数:", params)

# 绘制原始数据和预测结果
import matplotlib.pyplot as plt

plt.plot(x0, label='Original Data')
plt.plot(prediction, label='Predicted Data', linestyle='--')
plt.legend()
plt.show()