Logistic Regression基本原理解析

逻辑回归

基本概念

Logistic Regression 逻辑斯谛回归,属于对数线性模型,亦属于分类模型的一种。模型假设数据服从Logistic分布,然后使用极大似然估计做参数的估计。

首先我们需要了解什么是Logistic分布:

设X是连续随机变量,X服从逻辑斯谛分布是指X具有下列分布函数和密度函数:
F ( x ) = P ( X ≤ x ) = 1 1 + e − ( x − μ ) / γ F(x) = P(X \leq x) = \frac{1}{1+e^{-(x-\mu)/\gamma}} F(x)=P(Xx)=1+e(xμ)/γ1
f ( x ) = F ′ ( x ) = e − ( x − μ ) / γ γ ( 1 + e − ( x − μ ) / γ ) 2 f(x) = F'(x) = \frac{e^{-(x-\mu)/\gamma}}{\gamma(1+e^{-(x-\mu)/\gamma})^2} f(x)=F(x)=γ(1+e(xμ)/γ)2e(xμ)/γ
公式中, μ \mu μ是位置参数, γ \gamma γ是形状参数。

密度函数和分布函数的走势如下:

密度函数 分布函数 其中,分布函数是以点$(\mu,\frac{1}{2})$为中心对称的S形曲线,满足:

F ( − x + μ ) − 1 2 = − F ( x + μ ) + 1 2 F(-x+\mu)-\frac{1}{2} = -F(x+\mu)+\frac{1}{2} F(x+μ)21=F(x+μ)+21

什么是概率函数、什么是分布函数呢?

  • 概率密度函数:区间内的面积除以总面积,即为该区间的概率密度。

对于一维实随机变量X,设它的累积分布函数是 F X ( x ) F_X(x) FX(x),如果存在可测函数 f X ( x ) f_X(x) fX(x)满足: F X ( x ) = ∫ − ∞ x f X ( t ) d t F_X(x)=\int^{x}_{-\infty}{f_X(t)}dt FX(x)=xfX(t)dt,那么X是一个连续型随机变量,并且是它的概率密度函数。

概率密度
  • 分布函数:
    分布函数就是变量小于等于某个特定值a的概率(或者频率,如果是用数据统计出来的话),也即 F ( a ) = P { X < a } F(a)=P\{X<a\} F(a)=P{X<a}

逻辑回归模型

二项逻辑斯谛回归模型

定义:满足如下条件概率分布:
P ( Y = 1 ∣ x ) = e x p ( w ⋅ x + b ) 1 + e x p ( w ⋅ x + b ) P(Y= 1|x)=\frac{exp(w\cdot x+b)}{1+exp(w \cdot x+b)} P(Y=1x)=1+exp(wx+b)exp(wx+b)
P ( Y = 0 ∣ x ) = 1 1 + e x p ( w ⋅ x + b ) P(Y= 0|x)=\frac{1}{1+exp(w \cdot x+b)} P(Y=0x)=1+exp(wx+b)1
其中,x为输入,Y为输出。w为权重参数,b为偏置。
exp,以自然常数e为底的指数函数

当实例 x x x输入模型后,会计算出 Y = 1 Y=1 Y=1 Y = 0 Y=0 Y=0时候的概率值,模型将比较两个数值的大小,并将实例 x x x分到概率值较大的那一类。从输出上,也可以看出该模型是典型的0,1二分类模型。

从事件发生几率的角度上来说(该事件发生的概率与不发生的概率的比值),输出 Y = 1 Y=1 Y=1的对数几率是由输入 x x x的线性函数来表示的模型:
l o g i t ( p ) = l o g p 1 − p = l o g P ( Y = 1 ∣ x ) 1 − P ( Y = 1 ∣ x ) = w ⋅ x logit(p) = log \frac{p}{1-p}=log \frac{P(Y=1|x)}{1-P(Y=1|x)}=w\cdot x logit(p)=log1pp=log1P(Y=1x)P(Y=1x)=wx

多项逻辑斯谛回归模型

在二分类的基础上进行推广可以得到多分类模型。这里需要将输出的Y进行推广,从0,1推广至K。

定义:满足如下条件概率分布:
P ( Y = k ∣ x ) = e x p ( w k ⋅ x ) 1 + ∑ k = 1 K − 1 e x p ( w k ⋅ x ) , k = 1 , 2 , . . . , K − 1 P(Y= k|x)=\frac{exp(w_k\cdot x)}{1+\sum^{K-1}_{k=1}exp(w_k \cdot x)},k=1,2,...,K-1 P(Y=kx)=1+k=1K1exp(wkx)exp(wkx),k=1,2,...,K1
P ( Y = 0 ∣ x ) = 1 1 + ∑ k = 1 K − 1 e x p ( w k ⋅ x ) P(Y= 0|x)=\frac{1}{1+\sum^{K-1}_{k=1}exp(w_k \cdot x)} P(Y=0x)=1+k=1K1exp(wkx)1
其中,x为输入,Y为输出。w为权重参数,K为总的输出类个数。
exp,以自然常数e为底的指数函数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值