Logistics回归:第一部分

Logistics回归:第一部分

首先我觉得学这个分三个步骤,一是笼统了解大概,二是仔细研究推导过程,三则是实际应用。现在是第一部分,大致了解logistics regressions的整个流程

第一部分:
为了较好地掌握 logistic regression 模型,有必要先了解 线性回归模型 和 梯度下降法 两个部分的内容:

• 线性回归 —— Liner Regression

流程导图:
在这里插入图片描述
PS:一般情况都是多元线性回归,而核心思路于上面十分相似,但它是对数线性回归。核心的部分就是:假设y的衍生物是 y的对数即lny,那么就可以得到对数线性回归模型: , 也就是让模型 去逼近 lny,而不是y。也可以对lny=wTx+b 做一下变换就变成了 ,也可以理解为让 ewTx+b 去逼近y。形式上还是线性回归的,但实质上已是在求取输入空间到输出空间的非线性函数映射。
在这里插入图片描述
• 梯度下降法 —— 经典的优化方法
而梯度下降的核心思想就是下面这幅图,不断执行该过程即可收敛到局部极小点PS:这是对于凸函数才适用

在这里插入图片描述

接下来就正式讲logistics regression:

Logistics regression,其实在中文翻译中是叫逻辑斯蒂回归,但这其实是不准确的,按照他真正含义来翻译的话应该叫对数几率回归

而logistics regression 的本质是分类学习方法。理解这一个话十分重要!!!而他的应用层面十分广,而最常用的是二分类logistics,其因变量只有两个类别例如:“好”,“不好”等。主要是两大用途:一个是寻找危险因素,例如:寻找艾滋病的危险因素;而另一个就是用在预测,像股票升降预测。

我们再来讨论他名字来源。为什么叫对数几率呢??要引入一个概念几率(odds其实准确翻译应该叫优势比),也就是在这里插入图片描述 这样的形式,而y表示样本X作为正例的可能性,1-Y表示样本X作为反例的可能性。而几率这个概念则反映了X作为正例的相对可能性

而上面提到的对数线性回归,这里也就是把几率(odds)丢到对数线性回归中,变成对数几率回归。而其形式就变成了在这里插入图片描述 。然后我们再导入概率的知识让其变成 在这里插入图片描述
然后我们再来导入线性回归模型产生的预测值 。
最终得到了 这样的式子。在这里插入图片描述

其实我们理解完了logistics回归的来源。其实还有一些重点知识没有讲解。也就是这个东西到底是哪个知识点让他起到了二分类作用呢。

SIGMOD函数:

在这里插入图片描述

其中 是线性回归模型,产生得实值我们要将其转化为0或1进行分类,sigmoid函数正好具备这样的能力。也就是把线性回归模型放到SIGMOD函数中进行压缩,也就是下图所示:
在这里插入图片描述
我们就可以理解为当他>0.5的时候返回1,而<0.5的时候就返回0,这样就达到了二分类的作用。

我们理解了logistics函数后,接下来我们来讲讲到底如何来用这个东西来进行运算求出最终想到的模型
上面我们得到了 这个式子,那么很显然就分别有下面两个式子:
在这里插入图片描述
于是我们就可以通过极大似然发来估算w和b(这也是最终目的)。这里其实可以分为两个方法:一用上面说的线性回归里面的损失函数的方法。其思路其实是一样的。但是要注意,原本的损失函数在实际操作过程中是这样的:
在这里插入图片描述
使用梯度下降法求取极值很容易陷入到局部最优,而无法达到全局最优。因此要改变损失函数,然后再用梯度下降来逼近w和b。这里具体方法和推导过程就不进行阐述。而第二种方法,用的是“极大似然发”同样也是用梯度下降或拟牛顿法来逼近。


下次再来详细推导损失函数和梯度下降法来逼近w和b,还有极大似然法


最后再来总结一下流程:
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值