090005 逻辑回归

假设


其中:


于是高斯分布的概率为:


回到卖房子的问题,房价的误差应该服从高斯分布的随机变量,即


假设误差服从独立同分布IID,则Q的似然性定义为下式,也就是一系列高斯密度函数的乘积:


从定义来看,似然性和概率很相似,但是一般说数据的概率,参数的似然性。

训练的目的是使得参数似然性最大,也就是让数据出现的概率尽量大。为了数学证明的方便,定义对数似然函数:


为了使对数似然函数最大化,则要使后一项尽量大,因为有负号,所以要使下式最小化,从形式可以看出该式就是前面提到的代价函数J(Q)。


在最后的过程中忽略了,由于它是一个数据的方差,因此是个正数,因此取任何值都不会影响Q的取值。

常见的分类问题,结果只有是与不是,如人脸检测,病症判断,因此我们的结果集为:


因此需要选择一个函数,使得下式的输出值在0到1之间。


选择函数如下:
 

该函数称为Sigmoid function或者logistic function。该函数如下图所示,当z值小时趋向于0,当z值大时趋向于1,与y轴交于0.5。


有了这个函数,则对于输入值,输出值为0或1的概率可以表示为:


接下来需要解决的就是拟合参数的问题,计算参数的似然性。


对数似然函数为:


使用梯度上升方法求似然函数的最大值。


对Q求偏导数:


带入参数更新公式:


         这个和基于最小二乘回归获得的下降规则几乎完全一样,但是它们并不是一个算法,因为其中选用的回归函数不同,因为第一讲中选用的是线性函数,而这一讲中选用的是逻辑函数。很多方法经过推导都会得出相似的参数更新规则,但是由于模型选择不同,得到的是完全不同的方法。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值