决定系数R^2

最新推荐文章于 2024-06-01 14:04:00 发布

灵魂画手-编程如画

最新推荐文章于 2024-06-01 14:04:00 发布

阅读量2.2w

点赞数 8

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/grape875499765/article/details/78631435

版权

机器学习专栏收录该内容

33 篇文章 3 订阅

订阅专栏

在对数据进行线性回归计算之后,我们能够得出相应函数的系数, 那么我们如何知道得出的这个系数对方程结果的影响有强呢?
所以我们用到了一种方法叫 coefficient of determination (决定系数) 来判断回归方程拟合的程度.

0. 平均数

y ¯ = 1 n \sum i = 1 n y i

$\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_i$

1. THE TOTAL SUM OF SQUARES（总平方和）

S S t o t = \sum (y i - y ¯) 2

$SS_{tot}=\sum(y_i-\bar{y})^2$

yi $y_i$ 表示真实数据，

y¯ $\bar{y}$ 表示平均值

2. THE REGREESION SUM OF SQUARES（回归平方和）

S S r e g = \sum (f i - y ¯) 2

$SS_{reg}=\sum(f_i-\bar{y})^2$

fi $f_i$ 表示估计数据，

y¯ $\bar{y}$ 表示平均值

3. THE SUM OF SQUARES OF RESIDUALS（残差平方和）

S S r e s = \sum (y i - f i) 2

$SS_{res}=\sum(y_i-f_i)^2$

yi $y_i$ 表示真实数据，

fi $f_i$ 表示估算的数据

4. COEFFICIENT OF DETERMINATION（决定系数）

R 2 = 1 - S S r e s S S t o t

$R^2=1-\frac{SS_{res}}{SS_{tot}}$

由于 $SS_{res}$ 是估计数据也就是回归数据与平均值的误差
$SS_{tot}$ 是真实数据与平均值的误差
$SS_{res}$ 一般比 $SS_{tot}$ 小，结果一般在0-1之间， $SS_{tot}$ 在数据确定后始终是固定值，如果估计的越不准确，那么 $SS_{res}$ 就越大，那么 $R^2$ 就越接近0，所以估计的越准确就越接近1

sklearn实现的 $R^2$

from sklearn.metrics import r2_score  

def performance_metric(y_true, y_predict):  
    score = r2_score(y_true, y_predict)  
    return score  


score = performance_metric([3, -0.5, 2, 7, 4.2], [2.5, 0.0, 2.1, 7.8, 5.3])
print "Model has a coefficient of determination, R^2, of {:.3f}.".format(score)

自己实现的 $R^2$

def performance_metric2(y_true, y_predict):
    """计算并返回预测值相比于预测值的分数"""
    import numpy as np
    arr_true = np.array(y_true)
    y_mean = np.mean(arr_true)

    ssreg = 0
    sstotal = 0
    ssres = 0
    for item in y_predict:
        ssreg += (item - y_mean)**2
    for item in y_true:
        sstotal += (item - y_mean)**2
    for index,item in enumerate(y_true):
        ssres += (item - y_predict[index])**2

    score = 1-(ssres/sstotal)

    return score

score = performance_metric2([3, -0.5, 2, 7, 4.2], [2.5, 0.0, 2.1, 7.8, 5.3])
print "Model has a coefficient of determination, R^2, of {:.3f}.".format(score)

参考资料

决定系数的定义

灵魂画手-编程如画

关注

8
点赞
踩
69

收藏

觉得还不错? 一键收藏
1
评论
决定系数R^2

在对数据进行线性回归计算之后,我们能够得出相应函数的系数, 那么我们如何知道得出的这个系数对方程结果的影响有强呢? 所以我们用到了一种方法叫 coefficient of determination (决定系数) 来判断回归方程拟合的程度.0. 平均数y¯=1n∑i=1nyi\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_i1. SUM OF SQUARES DUE TO
复制链接

扫一扫