logistic regression研究,对于之前自我提问Q4理论证明和更新理解

昨天主要就是解决了logistic regression相关的问题,问题起因是我最开始不知道为什么我在程序里把1/(1+exp(-z))改成1/(1+exp(z))会出错,然后在没有理论支持的情况下把最后批量梯度下降时候的梯度添加一个负号,这个时候能收敛而且有结果,我当时鬼使神差地误认为1/(1+exp(-z))有特殊的含义,只能代表1的概率,1/(1+exp(z))只能代表0的概率,于是基于此开始推理,推出来另外一个形式的迭代公式,而这个迭代公式并不是简单的添加一个负号(当然不是啦,因为我已经假定了1/(1+exp(z))表示0的概率,这个的极大似然函数发生了变化)
这里写图片描述
当然这样也能算出来一组θ,但这个时候得到的prob就是0的概率,基于此我产生了一系列的问题不能自圆其说,因为假定不一样了,所以和博士讨论了一下,最后用推导和程序都证明了,logistic函数h(θ)可以随便令1/(1+exp(-z))是1的概率或者1/(1+exp(z))是1的概率,推导如下,蓝色字体博士推导的,推导的通用迭代表达式,我黑色字体推导的具体表达式
这里写图片描述
这里写图片描述
程序算出来也毫无问题,只是θ反号而已,所以回头来看就是当时我在尝试的时候对程序产生的结果理解错误,导致一系列猜想和问题,只不过这个过程下来,我对logistic的推导过程更加娴熟了,也从理论上证明了我上一次写的logistic回归问题自我答疑中的Q4,但是Q4也有点问题,h(θ)不一定非要是1的概率,也可以强行令h(θ)是0的概率,到时候迭代公式会相应的变化!以上!logistic还剩下的问题就是怎么去理解随机梯度下降,理解步长过大的震荡现象!
关于步长过大,博士有个理解,始终是按照极值点方向走,步长太大有可能就过了极值点,有可能损失函数变大了,也有可能损失函数变小,如果没有走过,那么函数值肯定是变小,所以有2/3的概率都会变小,所以步长太大,虽然要震荡但是更大的概率是使得函数值变小,所以函数值会逐步收敛!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值