R---简单线性回归

回归主要关注一个因变量(dependent variable)(也是需要预测的值)和一个或多个自变量(independent variable)
回归有很多种比如(线性回归、逻辑回归、泊松回归....)这里主要讨论线性回归。线性回归又可以分成简单线性回归 和 多元回归。[其中因变量假设是连续的]
简单线性回归:OLS(最小二乘法)
 ```
          y = a*x + b (拟合函数)
  ```      
 即通过数据集中的自变量 x 求出 因变量 y ,主要是求函数的参数  (a/b)
用的是最小二乘法, e = ∑((y-yp)^2); y是实际值,yp是预测值,e就是残差平方和
用的是使e最小,对a,b求偏导 = 0的方式,将a/b带入e中,分别求得b,a的值
  b = ∑(x-mean(x))∑(y-mean(y))/∑(x-mean(x))^2
or
  b = cov(x,y)/var(x)  # (x,y 的协方差除以 x 的方差)
  (补充:相关系数 cor = cov(x,y) / (sd(x)*sd(y))
   协方差:cov(x,y) = E[(X-E(X)(Y-E(Y))];协方差=0 则说明 x,y两组数据相互独立 )
多元回归:
 y = a*x + b
 与上面几乎一样,但是这时,a 是 一个向量,x 是一个矩阵,同样需要求取 a 的向量值,不过是运用矩阵的计算,比较复杂,但是r语言内置的lm函数会帮我计算的。

R中可以用基本包stats包中的是lm函数 or leap包中regsubsets函数
l_m <- lm(y~.,data)
l_pred <- predict(l_m,test)
summary(l_m)#可以看见残差,系数,显著性,赤池信息 等....

如果x(自变量)中有因子型变量,lm函数会自动对其进行哑变量处理,例如
a = ['q','b','b','q','w','w']
q = [1,0,0,1,0,0]
b = [0,1,1,0,0,0]
(w = [0,0,0,0,1,1]) #这一列是不需要的,也就是说R会将a中 n 个的因子转化成 n-1 哑变量。

leaps包(逐步回归法)
lp_m <- regsugsets(t~.,data,nvmax = ?(取决于变量数),method = 'forward'or'backward')#向前、向后逐步回归
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值