数学建模方法—【03】拟合优度的计算(python计算)

最新推荐文章于 2025-03-12 10:46:31 发布

别叫我派大星

最新推荐文章于 2025-03-12 10:46:31 发布

阅读量4.8w

点赞数 55

分类专栏：数学建模文章标签： python 拟合优度数据分析数学建模拟合

本文链接：https://blog.csdn.net/qq_43403025/article/details/108285275

版权

数学建模专栏收录该内容

17 篇文章

订阅专栏

拟合优度

1. 概念

引用百度百科定义:
拟合优度（Goodness of Fit）是指回归曲线对观测值的拟合程度。度量拟合优度的统计量是可决系数（亦称确定系数）R²。R²最大值为1。
规则: R²的值越接近1，说明回归曲线对观测值的拟合程度越好；反之，R²的值越小，说明回归曲线对观测值的拟合程度越差。
总而言之，拟合优度是用于度量拟合曲线对于原始数据拟合效果的好坏，拟合优度 $R^2$ 越接近1说明拟合优度越好，一般来说，拟合优度到达0.8以上就可以说拟合效果不错了。

2. 计算方法

         设 $y$ 为待拟合数据，y的均值为 $\overline{y}$ ，拟合数据为 $\widehat{y}$ ，则:
                1. 总平方和 SST(total sum of squares) : $\sum\limits_{i=1}^{n}(y_i - \overline{y})^2$
                2. 回归平方和 SSR(regression sum of squares) : $\sum\limits_{i=1}^{n}(\widehat{y}_i - \overline{y})^2$
                3. 残差平方和 SSE(error sum of squares) : $\sum\limits_{i=1}^{n}({y}_i - \widehat{y}_i)^2$

确定系数:
                 $R^2 = \frac{SSR}{SST}=1-\frac{SSE}{SST}$

3. Python代码

# #################################拟合优度R^2的计算######################################
def __sst(y_no_fitting):
    """
    计算SST(total sum of squares) 总平方和
    :param y_no_predicted: List[int] or array[int] 待拟合的y
    :return: 总平方和SST
    """
    y_mean = sum(y_no_fitting) / len(y_no_fitting)
    s_list =[(y - y_mean)**2 for y in y_no_fitting]
    sst = sum(s_list)
    return sst


def __ssr(y_fitting, y_no_fitting):
    """
    计算SSR(regression sum of squares) 回归平方和
    :param y_fitting: List[int] or array[int]  拟合好的y值
    :param y_no_fitting: List[int] or array[int] 待拟合y值
    :return: 回归平方和SSR
    """
    y_mean = sum(y_no_fitting) / len(y_no_fitting)
    s_list =[(y - y_mean)**2 for y in y_fitting]
    ssr = sum(s_list)
    return ssr


def __sse(y_fitting, y_no_fitting):
    """
    计算SSE(error sum of squares) 残差平方和
    :param y_fitting: List[int] or array[int] 拟合好的y值
    :param y_no_fitting: List[int] or array[int] 待拟合y值
    :return: 残差平方和SSE
    """
    s_list = [(y_fitting[i] - y_no_fitting[i])**2 for i in range(len(y_fitting))]
    sse = sum(s_list)
    return sse


def goodness_of_fit(y_fitting, y_no_fitting):
    """
    计算拟合优度R^2
    :param y_fitting: List[int] or array[int] 拟合好的y值
    :param y_no_fitting: List[int] or array[int] 待拟合y值
    :return: 拟合优度R^2
    """
    SSR = __ssr(y_fitting, y_no_fitting)
    SST = __sst(y_no_fitting)
    rr = SSR /SST
    return rr

举个栗子:

import random
import matplotlib.pyplot as plt
# 生成待拟合数据
a = np.arange(10)
# 通过添加正态噪声，创造拟合好的数据
b = a + 0.4 * np.random.normal(size=len(a))
print("原始数据为: ", a)
print("拟合数据为: ", b)
rr = goodness_of_fit(b, a)
print("拟合优度为:", rr)
plt.plot(a, a, color="#72CD28", label='原始数据')
plt.plot(a, b, color="#EBBD43", label='拟合数据')
plt.legend() 
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
plt.savefig(r"C:\Users\Yunger_Blue\Desktop\temp.jpg")
plt.show()

结果为:

原始数据为:  [0 1 2 3 4 5 6 7 8 9]
拟合数据为:  [0.23705933 1.20951491 2.37326542 3.00448608 3.48391211 4.30719527 5.95446175 7.50969723 8.97662945 8.27064816]
拟合优度为: 0.9971013400436336

在这里插入图片描述