逻辑回归梯度下降法的推导过程

逻辑回归代价函数的求导过程推导


逻辑回归的代价函数可以统一写成如下一个等式:

J(θ)=1m[mi=1y(i)log(hθ(x(i)))+(1y(i))log(1hθ(x(i)))] J(θ)=−1m[∑i=1my(i)log(hθ(x(i)))+(1−y(i))log(1−hθ(x(i)))]


其中: hθ(x(i))=11+eθTx hθ(x(i))=11+e−θTx


为了避免求导过程太冗长复杂,我们做一些显示的简化:

J(θ)=1m[mi=1K(θ)] J(θ)=−1m[∑i=1mK(θ)]


其中:


K(θ)=y(i)log(hθ(x(i)))+(1y(i))log(1hθ(x(i))) K(θ)=y(i)log(hθ(x(i)))+(1−y(i))log(1−hθ(x(i)))

hθ(x(i))=11+eθTx hθ(x(i))=11+e−θTx


下面开始我们的推导过程:如果要求 J(θ) J(θ)对某一个参数 θ θ的偏导数,则:

(1)根据求导公式,可以先把常数项 1mmi=1 −1m∑i=1m提取出来,这样就只需要对求和符号内部的表达式求导,即:

J(θ)=1m[mi=1K(θ)] J(θ)′=−1m[∑i=1mK(θ)′]


K(θ)=(ylog(hθ(x))+(1y)log(1hθ(x))) K(θ)′=(ylog(hθ(x))+(1−y)log(1−hθ(x)))′

(为方便显示,先把右上角表示第i个样本的上标去掉) 


(2)根据对数复合求导公式, log(x)=1xx log(x)′=1xx′,对 K(θ) K(θ)继续求导可得:

K(θ)=y1hθ(x)hθ(x)+(1y)11hθ(x)(1hθ(x))


K(θ)′=y1hθ(x)hθ(x)′+(1−y)11−hθ(x)(1−hθ(x))′


(3)根据幂函数复合求导公式, (yx)=xyx1x (yx)′=xyx−1x′,及以e为底的指数求导公式,对 hθ(x) hθ(x)继续求导可得:

hθ(x)=(11+eθTx)=(1+eθTx)(1+eθTx)2=eθTx(θTx)(1+eθTx)2=(11+eθTx(111+eθTx))(θTx)=hθ(x)(1hθ(x))(θTx)


hθ(x)′=(11+e−θTx)′=−(1+e−θTx)′(1+e−θTx)2=e−θTx(θTx)′(1+e−θTx)2

        =(11+e−θTx(1−11+e−θTx))(θTx)′=hθ(x)(1−hθ(x))(θTx)′


同理,



(1hθ(x))=eθTx(θTx)(1+eθTx)2=hθ(x)(1hθ(x))(θTx)

(1−hθ(x))′=−e−θTx(θTx)′(1+e−θTx)2=−hθ(x)(1−hθ(x))(θTx)′


(4)把步骤3的结果带入步骤2,化简后可得:

  K(θ)=(yhθ(x))(θTx) K(θ)′=(y−hθ(x))(θTx)′


再把上面结果带入步骤1,化简后可得:

  J(θ)=1m[mi=1(hθ(x)y)(θTx)] J(θ)′=1m[∑i=1m(hθ(x)−y)(θTx)′]


最后 (θTx) (θTx)′,对第j个 θ θ求偏导,结果即 Xj Xj(j表示样本中第几项),得到最终结果:

  J(θ)θj=1m[mi=1(hθ(x(i))y(i))x(i)j]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值