Logistic Regression

模型定义

特征 x:m*n
label y:m*1
不同的x, 参数对应一个不同的二项分布
这些二项分布可以通过统计求得

改进

不按照x是否相同,来统计其二项分布的分布律,而每一个样本点都看做一个独立二项分布
这里写图片描述

这样的特点就是这样的二项分布只有俩种,分别为

这里写图片描述
并且能合并表示为

这里写图片描述
这里写图片描述

目标函数——交叉熵

小目标:对于每一个样本点,分别求出一个分布,使得俩者分布差距最小

模型目标:所有的样本差距之和最小

KL散度

Kullback-Leibler Divergence,即K-L散度,是一种量化两种概率分布P和Q之间差异的方式,又叫相对熵。在概率学和统计学上,我们经常会使用一种更简单的、近似的分布来替代观察数据或太复杂的分布。K-L散度能帮助我们度量使用一个分布来近似另一个分布时所损失的信息。

这里写图片描述

K-L散度是数据的原始分布p和近似分布q之间的对数差值的期望

这里写图片描述

其中分布p是我们上面统计出来的数据分布

KL散度与交叉熵的关系

这里写图片描述

目标表示

小目标:对于每一个样本点,分别求出一个分布,使得俩者分布差距最小
这里写图片描述

模型目标:所有的样本差距之和最小

这里写图片描述

目标函数——极大似然估计

同样认为对于每一个样本点都是一个P(y)的二项分布
这里写图片描述

L() 代表获得到样本的概率,希望概率越大越好
这里写图片描述

求对数似然

模型求解

这里写图片描述

这里写图片描述

参考:
1. KL散度的介绍:https://www.jianshu.com/p/43318a3dc715
2. KL散度,交叉熵的关系;在Logistic回归中的应用
3. 邹博老师的课件

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值