Logistic Regression

最新推荐文章于 2024-02-27 17:17:30 发布

云端潜行

最新推荐文章于 2024-02-27 17:17:30 发布

阅读量166

点赞数

分类专栏：机器学习 Machine Learning based on online resources

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/niukai1768/article/details/80400352

版权

机器学习同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

Machine Learning based on online resources

4 篇文章 0 订阅

订阅专栏

模型定义

特征 x：m*n
label y：m*1
不同的x, 参数对应一个不同的二项分布
这些二项分布可以通过统计求得

改进

不按照x是否相同，来统计其二项分布的分布律，而每一个样本点都看做一个独立二项分布
这里写图片描述

这样的特点就是这样的二项分布只有俩种，分别为

这里写图片描述
并且能合并表示为

这里写图片描述

目标函数——交叉熵

小目标：对于每一个样本点，分别求出一个分布，使得俩者分布差距最小

模型目标：所有的样本差距之和最小

KL散度

Kullback-Leibler Divergence，即K-L散度，是一种量化两种概率分布P和Q之间差异的方式，又叫相对熵。在概率学和统计学上，我们经常会使用一种更简单的、近似的分布来替代观察数据或太复杂的分布。K-L散度能帮助我们度量使用一个分布来近似另一个分布时所损失的信息。

这里写图片描述

K-L散度是数据的原始分布p和近似分布q之间的对数差值的期望

这里写图片描述

其中分布p是我们上面统计出来的数据分布

KL散度与交叉熵的关系

这里写图片描述

目标表示

小目标：对于每一个样本点，分别求出一个分布，使得俩者分布差距最小
这里写图片描述

模型目标：所有的样本差距之和最小

这里写图片描述

目标函数——极大似然估计

同样认为对于每一个样本点都是一个P(y)的二项分布
这里写图片描述

L() 代表获得到样本的概率，希望概率越大越好
这里写图片描述

求对数似然

模型求解

这里写图片描述

这里写图片描述

参考:
1. KL散度的介绍：https://www.jianshu.com/p/43318a3dc715
2. KL散度，交叉熵的关系；在Logistic回归中的应用
3. 邹博老师的课件

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Logistic Regression

模型定义特征 x：m*n label y：m*1 不同的x, 参数对应一个不同的二项分布这些二项分布可以通过统计求得改进不按照x是否相同，来统计其二项分布的分布律，而每一个样本点都看做一个独立二项分布这样的特点就是这样的二项分布只有俩种，分别为并且能合并表示为目标函数——交叉熵小目标：对于每一个样本点，分别求出一个分布，使得俩者分布差距最小模...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。