统计学基础知识梳理(四)

本文介绍了统计学中的线性回归概念,包括最合适的线性回归线的确定、决定系数R平方的解释及其计算,以及协方差在回归线斜率计算中的应用。接着讲解了卡方分布的生成和自由度的概念,卡方检验在衡量拟合程度和独立性方面的用途。此外,还涵盖了方差分析中的平方和和F假设检验,以及相关性和因果性的区别。
摘要由CSDN通过智能技术生成

线性回归

在坐标上分布很多点,这些点可以通过y=mx+b的直线进行近似模拟,如图。最合适的线性回归线(Best fitting regression)就是Error的方差最小,即Square error to the line: SEline最小。我们需要找寻SEline最小时m和b的值,即find the m & b that minimizes SEline。

线性回归公式推导

假设我们有n个点,(x1,y1), (x2,y2), ... ,(xn,yn),如下图所示:

我们要求这几个点的线性回归方程,假设方程为y=mx+b,如下图所示:

即求:

决定系数:

描述的是X波动对Y波动的影响度。

决定系数 R平方 = 1 - SE line (Y对于回归线距离的平方和)/ SE Y均 (Y对于 Y平均值距离的平方和),这个系数是对回归方程拟合程度的判断,当R平方接近于1时,说明直线拟合的很好。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值