9.回归中的相关度和决定系数

angyinyan0208

于 2018-11-02 21:21:23 发布

阅读量6.4k

点赞数 2

分类专栏：深度学习算法计算机文章标签：决定系数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/angyinyan0208/article/details/83661375

版权

博客探讨了在回归分析中如何衡量特征与结果的相关性。皮尔逊相关系数用于度量两个变量间的线性相关性，值在-1到1之间，0表示无线性相关。决定系数（R平方）则表示自变量能解释因变量变异的比例，修正决定系数考虑了自变量数量的影响，防止过拟合。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

起步

训练集中可能有若干维度的特征。但有时并不是所有特征都是有用的，有的特征其实和结果并没有关系。因此需要一个能衡量自变量和因变量之间的相关度。

皮尔逊相关系数

皮尔逊相关系数( Pearson correlation coefficient），是用于度量两个变量 X 和 Y 之间的相关（线性相关），其值介于 -1 与 1 之间。

在说皮尔逊相关系数之前，要先理解协方差( Covariance ) ，协方差是一个反映两个随机变量相关程度的指标，如果一个变量跟随着另一个变量同时变大或者变小，那么这两个变量的协方差就是正值，反之相反，公式如下：

相关度越高，皮尔逊相关系数其值趋于 1 或 -1 （趋于1表示它们呈正相关，趋于 -1 表示它们呈负相关）；如果相关系数等于0，表明它们之间不存在线性相关关系。

对应的python实现<

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。