一、逻辑斯蒂分布
设X是连续随机变量,X服从逻辑斯蒂分布是指X具有下列分布函数和密度函数
F(x)=P(X≤x)=11+e−(x−μ)/γf(x)=F′(x)=e−(x−μ)/γγ(1+e−(x−μ)/γ)2(1)(2)
二、逻辑斯蒂回归模型
二项逻辑斯蒂回归模型是一种分类模型,由条件概率分布p(Y|X)表示,形式为参数化的逻辑斯蒂分布。这里,随机变量X取值为实数,随机变量Y取值为1或0.
概率分布定义如下:
P(Y=1|x)=ew⋅x+b1+ew⋅x+bP(Y=0|x)=11+ew⋅x+b(3)(4)
对于给定的输入实例x,按照(3),(4)式计算,比较两个条件概率的大小,将实例x分到概率值较大的那一类。
有时为了方便,将权值向量和输入向量加以扩充,
w=(w(1),w(2),⋯,w(n),b),x=(x(1),x(2),⋯,x(n),1)
,这时逻辑斯蒂回归模型如下:
P(Y=1|x)=ew⋅x1+ew⋅xP(Y=0|x)=11+ew⋅x(5)(6)
一个事件发生的几率是指该事件发生的概率与不发生的概率的比值,对于逻辑回归而言,几率的对数为
logP(Y=1|x)1−P(Y=1|x)=w⋅x(7)
这就是说,在逻辑斯蒂回归模型中,输出Y=1的对数几率是输入x的线性函数。线性函数的值越接近正无穷,概率值越接近1,线性函数的值越接近负无穷,概率值就越接近0.
三、模型参数估计
可以应用极大似然估计法估计模型的参数,从而得到逻辑斯蒂回归模型
设 P(Y=1|x)=π(x),P(Y=0|x)=1−π(x)
似然函数为
∏i=1Nπ(x)yi(1−π(x))(1−yi)
对数似然函数为
L(w)=log∏i=1Nπ(xi)yi(1−π(xi))(1−yi)=∑i=0N{yilog(π(xi))+(1−yi)log(1−π(xi))}=∑i=1N{yilogπ(xi)1−π(xi)+log(1−π(xi))}=∑i=1N{yi(w⋅xi)−log(1+ew⋅x)}(8)
对L(w)求极大值,得到w的估计值。
w=argminw∑i=1N{log(1+ew⋅x)−yi(w⋅xi)}
剃度下降法求解w
∂l∂w=∑i=1N(yixi−π(xi)xi)=∑i=1N(yi−π(xi))xi
w:=w+λ∑i=1N(yi−π(xi))xi