机器学习预测结果评价的score方法取值分类及决定系数R^2(Coefficient of Determination)的原理及推导

最新推荐文章于 2024-06-28 09:55:05 发布

Zen of Data Analysis

最新推荐文章于 2024-06-28 09:55:05 发布

阅读量8.7k

点赞数 5

分类专栏：机器学习统计算法文章标签：机器学习算法统计基础

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gracejpw/article/details/101546293

版权

score方法的取值分类

Python机器学习sklearn里的score()方法，主要用于度量给定测试集的预测效果的好坏。

当y为连续变量时，score的取值为R²；当y为分类变量时，score的取值为准确率accuracy。

其中：

R² =（1-u/v）,
u=((y_true - y_pred) ** 2).sum(),
v=((y_true - y_true.mean()) ** 2).sum()；

accuracy=分类算法正确的分类数/总分类数。

决定系数R²(Coefficient of Determination)的性质

决定系数(记为R²或r²)，亦称测定系数、可决系数、可决指数。与复相关系数类似的，在统计学中用于度量因变量的变异中可由自变量解释部分所占的比例，以此来判断统计模型的解释力。

对于简单线性回归而言，判定系数为样本简单相关系数(记为R或r)的平方（简单相关系数又称皮尔逊相关系数或者线性相关系数）。当加入其他回归自变量后，决定系数相应地变为多重相关系数的平方。

R²的公式

R² =（1-u/v）,
u=((y_true - y_pred) ** 2).sum(),
v=((y_true - y_true.mean()) ** 2).sum()
或者：
R²=SSE/SST=1-SSR/SST

R²的原理

首先说明一下几个参数的定义：

离差

一个特定数值对于其平均值的偏离

变异

一变量的各数值对于其平均值的偏离，称为变异。通常用离差平方和来描述变异程度。

离差平方和

离差平方和又简称平方和(Sum of square)。

均方(Mean square)

平方和被相应的自由度去除，得到平均平方，简称为均方(Mean square)。

样本标准差

样本标准差就是被自由度(n-1)所平均x对于 $\overline{x}$ 的离差均方的算术平方根。

最低0.47元/天解锁文章

Zen of Data Analysis

关注

5
点赞
踩
32

收藏

觉得还不错? 一键收藏
2
评论
机器学习预测结果评价的score方法取值分类及决定系数R^2(Coefficient of Determination)的原理及推导

Python机器学习sklearn里的score()方法，主要用于度量给定测试集的预测效果的好坏。当y为连续变量时，score的取值为R^2^；当y为分类变量时，score的取值为准确率accuracy。其中：R^2^ =（1-u/v）,u=((y_true - y_pred) ** 2).sum(),v=((y_true - y_true.mean()) ** 2).sum()；accuracy=分类算法正确的分类数/总分类数。决定系数R^2(Coefficient of Determination)
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。