pythont检验筛选变量_python数据分析之线性回归,各种检验和解决方法!

线性回归

(1)线性回归的主要内容:

1318455-20180121085936287-2001441525.png

1318455-20180121090110646-1252954917.png

有兴趣可以玩一下这个游戏:是猜相关系数的,给你一些散点图,猜相关系数,很难猜对,说明看图说明相关性不靠谱!

1318455-20180121090237740-1121193397.png

1318455-20180121090445490-1596946642.png

(2)线性回归怎么做?数学公式

1318455-20180121090511537-1098924909.png

一个简单线性回归的例子:

1318455-20180121090618912-1426475315.png

ols:

1318455-20180121090752959-225163869.png

拟合优度:

1318455-20180121091024287-1859090322.png

(3) 假设检验

1318455-20180121091233271-1985473028.png

1318455-20180121091328412-838906190.png

线性回归这位老师用的是statsmodels做的。

1318455-20180121091640896-1742752694.png

这就是用线性回归拟合出来的模型!

1318455-20180121091705662-842542930.png

使用这个函数可以直接得到模型的一些结果,会得到这些表!

1318455-20180121091800209-2112012571.png

这个是预测的函数:predict(x)。这是这个包的函数!

1318455-20180121093028443-1807964026.png

二、多元线性回归

也可以用向量的方式。

1318455-20180121103308740-1420190752.png

1318455-20180121103359037-109272526.png

参数是迭代计算的,此处不讲了。

模型的检验

1318455-20180121103641553-152844571.png

只用与 模型的选择 调整的r方。避免的样本量的影响,预防过拟合!

1318455-20180121103704771-901816649.png

python中的实现 试用stats model 多个变量用+连一起!

1318455-20180121103948615-1965804438.png

模型的一些值

1318455-20180121104204256-1571662038.png

变量的筛选,除了常规的,就是使用相前,向后还有逐步,还有全子集的方法。

不多介绍,上篇也讲过。

python需要自己写来实现,当然我不会,这里可以用spss去实现

这是python代码

1318455-20180121104947490-2076688076.png

1318455-20180121105007521-546079032.png

跳过。。。

回归的假设。

1318455-20180121105035803-1280680900.png

线性

1318455-20180121105102553-1395564251.png

1318455-20180121105120631-1559802605.png

1318455-20180121105207037-61575182.png

1318455-20180121105416990-1770598850.png

1318455-20180121105834365-1784404339.png

1318455-20180121105911662-981881704.png

强影响点筛选,然后直接删除

1318455-20180121142950162-771110270.png

1318455-20180121142848021-1264410227.png

1318455-20180121143010553-283386057.png

1318455-20180121143710193-1830358743.png

1318455-20180121143723678-1179853472.png

强烈建议用spss进行多元线性回归建模。不过为了熟悉python明天打算用python更着去实现。

自己整理一下,多元线性回归的检验方法:

整体显著性检验:回归模型出来时候,可以之间看整体的F检验的p值

拟合优度检验:最简单的就看R方和调整的R方

系数检验:T检验结果,可以直接看P值

自相关检验:dw检验用得最多

异方差检验:Goldfeld - Quandt 检验法,这个方法挺好的的。其实还有其他检验方法,解决办法是建议取对数

共线性检验:vif值

1318455-20180121145419412-628937079.png

1318455-20180121145627881-1566175526.png

不够细,明日具体操作的时候会细点!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值