1.数据字典:
回归:具有某一极端特征的个体在未来某一时刻将减弱它的极端性,这一趋势被称作“回归效应”。
四个字概括:物极必反。
如:Galton的豌豆实验,大颗粒豆子的子代会较小,小颗粒豆子的子代会较大。
ρ:总体相关系数
r: 样本相关系数,简称相关系数。
自变量:可控变量。
因变量:不可供变量,受到自变量影响。
Pearson相关系数:r=( x、y的协方差)/(x的标准差*y的标准差)
2.意义
反映两件事物之间的线性相关性。
如:小孩身高与父母身高的相关性;小孩身高与运动时间和饮水量的相关性。
3.先关系数的显著性检验
显著性检验:检验两个变量之间是否存在线性相关关系
方法:采用R.A.Fisher提出的 t检验
步骤:
- 提出假设:H0:ρ = 0 ;H1:ρ ≠0
- 计算检验的统计量:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ukyf8qz8-1589094234901)(evernotecid://E25D8D55-D9E0-4C87-8FA3-B57123881B5F/appyinxiangcom/8212281/ENResource/p2993)] - 计算P值,做出决策:
若P<α,则拒绝H0 - 经验法则:r < |0.8| ; r ∈ (0.3,0.5) ; r<0.3
回归分析
已知两个变量具有相关关系,进一步确定反映它们之间关系的模型。