Logistic 回归

Logistic 回归:从入门到进阶(之一)

——如何理解Logistic回归


我们在做统计分析之前,往往会做个散点图,以对数据有直观的了解。今天,我们就从散点图入手,来探究Logistic回归的奥秘。


如下,分别是连续型因变量和二分类因变量的散点图。很直观的,我们会想到用一条直线来代表左图中两个变量的关系。那么右图中,用一条什么样的线来代表呢?


如下,左图可以完美地拟合出一条直线;而右图如果绘制成S型曲线,意义就与左图有所不同了。


右图的纵轴已经换成了P值。所以右图曲线上的点,代表的就是在对应x位置,Y取到1的概率(即取到二分类变量中上方变量值的概率),Y轴label顺理成章换为了P-概率值。


有了拟合曲线,另一个问题就产生了。代表P值的曲线与自变量并非线性关系!那如何转化为线性关系,以方便我们写成y=ax+b的形式进行参数估计呢?


因此,就需要我们引入logit函数的概念。


如下左图中,β+βX与p的关系,是一条S曲线的关系;而我们引入logit函数,p与log(p/(1-p))的关系,恰好是一条反S曲线的关系。把二者一整合,负负为正,就得到了我们所期望的直线关系,即log(p/(1-p))=β+βX,就是所谓的Logistic回归方程。


这个logit函数,在广义线性模型中,就被成为连接函数。


我们实际上有很多种类的连接函数,可以构造很多种的回归。因为这里的函数恰好被叫做logit函数,所以,理所当然地,这个回归也就被称为Logistic回归。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值