统计学基础13-回归分析

一. 相关系数

1.1 关系

关系分为两种:

  1. 函数关系
    确定关系,例如: y=3+10*x

  2. 相关关系
    非确定关系
    image.png

1.2 相关系数概述

我们使用相关系数这一指标去衡量两个变量之间的线性关系程度。
image.png

image.png

1.3 相关系数公式

要求:

  1. 成为数据(x,y)组成的样本是一个随机样本
  2. 数据对(x,y)的散点图要呈现出近视线性相关性
  3. 要把离群值排除

相关系数计算公式:
image.png

1.4 相关系数r的性质

r的性质:

  1. r的范围是-1到1

  2. 如果某个变量的所有值都转换为一个不同的度量单位,r值不变。

  3. r值不受x、y的选择影响。交换所有的x值与y值,r不便。

  4. r是线性相关性的强度的度量,不适用于非线性相关的关系。

  5. r非常容易受到离群值的影响,当有离群值存在的时候,r可能变得非常不一样

1.5 可解释变异 r 2 r^2 r2

Y变异的来源:

  1. x变异造成的-可解释变异
  2. 除x外的因素变异造成的,如随机抽样引起的误差

r 2 r^2 r2放映了y变异中由x变异引起的变异所占总变异的比例,也就是 r 2 r^2 r2的值是由x和y之间的线性相关性说解释的y的变异变异比例。

1.6 常见错误

  1. 误将相关关系认为是因果关系
  2. 局部求平均数后再用于计算会使变异减少,相关性增大
  3. 不存在线性相关性,不意味着两个变量没有关系,可能会存在其他非线性关系

1.7 相关系数

image.png

例子:
image.png
image.png
image.png

二. 回归模型

image.png

2.1 一元线性回归模型

image.png

image.png

2.1.1 如何确定参数

image.png
image.png

例子:
image.png

2.1.2 回归系数显著性检验

image.png
image.png
image.png

例子:
image.png

2.1.3 回归诊断-残差图

image.png

2.2 多元线性回归模型

image.png

参数估计:
image.png

R 2 R^2 R2
image.png

image.png

例子:
image.png

三. 虚拟变量

image.png

参考:

  1. http://www.dataguru.cn/article-4362-1.html
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值