统计学学习——004多元线性回归和卡方分布

线性回归就是假设特征满足线性关系,根据已经获得一些数据来训练一个模型,并用这个模型进行预测。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析
模型给出了我们要学习的函数形式。
h w ( x i ) = w 0 + w 1 x 1 + w 2 x 2 + . . . + w n x n = W T X h_w(x^i) = w_0 + w_1x_1 + w_2x_2 + ... + w_nx_n = W^TX hw(xi)=w0+w1x1+w2x2+...+wnxn=WTX

(1)均方误差MSE
在这里插入图片描述
(2)平均绝对误差MAE
在这里插入图片描述
损失函数为
J ( W ) = 1 2 M ∑ i = 1 M ( h w ( x i ) − y i ) 2 = 1 2 M ( X W − Y ) T ( X W − Y ) J(W) = \frac{1}{2M}\sum_{i=1}^{M}(h_w(x^i) - y^i)^2 = \frac{1}{2M}(XW - Y)^T(XW - Y) J(W)=2M1i=1M(hw(xi)yi)2=2M1(XWY)T(XWY)

若n个相互独立的随机变量ξ₁,ξ₂,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
卡方分布的 期望E(χ2)=n,方差D(χ2)=2n。
卡方分布的概率密度函数为:
在这里插入图片描述

在这里插入图片描述
从分布图可以看出:分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数 n 的增大,分布趋近于正态分布;随着自由度n的增大,分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值