一元线性回归分析

一元线性回归分析:

在这里插入图片描述

(1)假设X与Y有线性相关关系,求Y与X样本回归直线方程,并求在这里插入图片描述
的无偏估计;
(2)检验Y和X之间的线性关系是否显著(α=0.05);
(3)当X=x0时,求Y置信度为95%的预测区间;令:x0为学号后两位乘以0.01.
(4)为了把Y的观测值限制在(1.08,1.68),需把的值限制在什么范围(α=0.05)?

解答:
(1)首先,计算X和Y的样本均值和样本标准差:
x ‾ = 0.67 ,   y ‾ = 1.77 \overline{x} = 0.67,\ \overline{y} = 1.77 x=0.67, y=1.77
s x = 0.23 ,   s y = 0.49 s_x = 0.23,\ s_y = 0.49 sx=0.23, sy=0.49
然后,计算样本相关系数 r r r
r = ∑ i = 1 n ( x i − x ‾ ) ( y i − y ‾ ) ∑ i = 1 n ( x i − x ‾ ) 2 ∑ i = 1 n ( y i − y ‾ ) 2 = − 0.981 r = \frac{\sum_{i=1}^n(x_i-\overline{x})(y_i-\overline{y})}{\sqrt{\sum_{i=1}^n(x_i-\overline{x})^2\sum_{i=1}^n(y_i-\overline{y})^2}} = -0.981 r=i=1n(xix)2i=1n(yiy)2 i=1n(xix)(yiy)=0.981
接下来,计算回归系数 b b b和截距 a a a
b = r s y s x = − 2.13 b = r\frac{s_y}{s_x} = -2.13 b=rsxsy=2.13
a = y ‾ − b x ‾ = 3.09 a = \overline{y} - b\overline{x} = 3.09 a=ybx=3.09
因此,Y与X的样本回归直线方程为 y = 3.09 − 2.13 x y = 3.09 - 2.13x y=3.092.13x。根据样本回归直线方程,可以计算出DY的无偏估计:
σ ^ 2 = ∑ i = 1 n ( y i − y ^ i ) 2 n − 2 = 0.026 \hat{\sigma}^2 = \frac{\sum_{i=1}^n(y_i - \hat{y}_i)^2}{n-2} = 0.026 σ^2=n2i=1n(yiy^i)2=0.026

(2)进行线性关系的显著性检验,需要计算回归平方和 S S R SSR SSR、残差平方和 S S E SSE SSE和总平方和 S S T SST SST
S S R = ∑ i = 1 n ( y ^ i − y ‾ ) 2 = 5.07 SSR = \sum_{i=1}^n(\hat{y}_i - \overline{y})^2 = 5.07 SSR=i=1n(y^iy)2=5.07
S S E = ∑ i = 1 n ( y i − y ^ i ) 2 = 0.26 SSE = \sum_{i=1}^n(y_i - \hat{y}_i)^2 = 0.26 SSE=i=1n(yiy^i)2=0.26
S S T = ∑ i = 1 n ( y i − y ‾ ) 2 = 5.33 SST = \sum_{i=1}^n(y_i - \overline{y})^2 = 5.33 SST=i=1n(yiy)2=5.33
根据F检验公式,计算F值:
F = S S R / 1 S S E / ( n − 2 ) = 100.13 F = \frac{SSR/1}{SSE/(n-2)} = 100.13 F=SSE/(n2)SSR/1=100.13
查F分布表可知,在显著性水平为0.05时,自由度为(1, 7)时的临界值为4.30。因为计算得到的F值大于临界值,所以拒绝原假设,即认为Y和X之间的线性关系是显著的。

(3)当 x 0 = 0.56 x_0=0.56 x0=0.56时,代入样本回归直线方程可得:
y ^ 0 = 3.09 − 2.13 × 0.56 = 1.87 \hat{y}_0 = 3.09 - 2.13\times0.56 = 1.87 y^0=3.092.13×0.56=1.87
根据样本回归直线方程和 σ ^ 2 \hat{\sigma}^2 σ^2,可以计算出 x 0 x_0 x0处的预测区间:
y ^ 0 ± t n − 2 , α / 2 σ ^ 2 ( 1 + 1 n + ( x 0 − x ‾ ) 2 ∑ i = 1 n ( x i − x ‾ ) 2 ) \hat{y}_0 \pm t_{n-2,\alpha/2}\sqrt{\hat{\sigma}^2\left(1+\frac{1}{n}+\frac{(x_0-\overline{x})^2}{\sum_{i=1}^n(x_i-\overline{x})^2}\right)} y^0±tn2,α/2σ^2(1+n1+i=1n(xix)2(x0x)2)
代入数据可得:
1.87 ± 2.306 × 0.231 = ( 1.36 , 2.38 ) 1.87 \pm 2.306\times0.231 = (1.36, 2.38) 1.87±2.306×0.231=(1.36,2.38)
因此,当X=0.56时,Y的置信度为95%的预测区间为(1.36, 2.38)。

(4)为了把Y的观测值限制在(1.08, 1.68)范围内,需要限制X的取值范围。根据样本回归直线方程,当 y = 1.08 y=1.08 y=1.08时, x = 0.98 x=0.98 x=0.98;当 y = 1.68 y=1.68 y=1.68时, x = 0.28 x=0.28 x=0.28。因此,限制X的取值范围为(0.28, 0.98)。进行检验,需要计算出限制后的回归平方和 S S R ′ SSR' SSR、残差平方和 S S E ′ SSE' SSE和总平方和 S S T ′ SST' SST
S S R ′ = ∑ i = 1 n ( y ^ i ′ − y ‾ ) 2 = 0.83 SSR' = \sum_{i=1}^n(\hat{y}_i' - \overline{y})^2 = 0.83 SSR=i=1n(y^iy)2=0.83
S S E ′ = ∑ i = 1 n ( y i − y ^ i ′ ) 2 = 0.08 SSE' = \sum_{i=1}^n(y_i - \hat{y}_i')^2 = 0.08 SSE=i=1n(yiy^i)2=0.08
S S T ′ = ∑ i = 1 n ( y i − y ‾ ) 2 = 0.91 SST' = \sum_{i=1}^n(y_i - \overline{y})^2 = 0.91 SST=i=1n(yiy)2=0.91
根据F检验公式,计算F值:
F = S S R ′ / 1 S S E ′ / ( n − 2 ) = 10.38 F = \frac{SSR'/1}{SSE'/(n-2)} = 10.38 F=SSE/(n2)SSR/1=10.38
查F分布表可知,在显著性水平为0.05时,自由度为(1, 7)时的临界值为4.30。因为计算得到的F值大于临界值,所以拒绝原假设,即认为限制X的取值范围可以把Y的观测值限制在(1.08, 1.68)范围内。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值