对数几率回归是二分类的问题,我们可以将随机变量 y y y假设服从伯努利分布,即 y y y的取值只有{0,1}。
这里需要补充一个概念,指数族分布,伯努利分布就属于指数族分布。
(注: ϕ \phi ϕ指的是 y y y取1是的概率)
我们都明白对数几率回归是从线性回归衍生而来的,所以我们下一步就是进行对数几率回归模型的推导。
1、 对数几率回归的广义线性模型推导
对于广义线性模型,有三条假设。
符合这三条假设的模型便是广义线性模型了。
对于假设一,我们的随机变量符合伯努利分布所以成立。
对于假设二,我们设:
h ( x ) = E ( T ( y ) ) h(x)=E(T(y)) h(x)=E(T(y)),又因为伯努利分布中 T ( y ) = y T(y)=y T(y)=y
所以 h ( x ) = E ( y ) = 1 ⋅ p ( y = 1 ) + 0 ⋅ p ( y = 0 ) = ϕ h(x)=E(y)=1\cdot p(y=1)+0 \cdot p(y=0)=\phi h(x)=E(y)=1⋅p(y=1)+0⋅p(y=0)=ϕ
对于假设三,因为 η = ln ( ϕ 1 − ϕ ) \eta=\ln(\frac{\phi}{1-\phi}) η=ln(1−ϕϕ),所以我们可以得到 ϕ = 1 1 + e − η \phi=\frac{1}{1+e^{-\eta}} ϕ=1+e−η1
因为 η = w T x \eta=w^Tx η=wTx,所以 h ( x ) = ϕ = 1 1 + e − η = 1 1 + e − w T x = p ( y = 1 ∣ x ) h(x)=\phi=\frac{1}{1+e^{-\eta}}=\frac{1}{1+e^{-w^Tx}}=p(y=1|x) h(x)=ϕ=1+e−η1=1+e−wT