对数几率回归模型推导

最新推荐文章于 2023-08-04 22:08:06 发布

USER20230401

最新推荐文章于 2023-08-04 22:08:06 发布

阅读量389

点赞数 2

文章标签：回归机器学习逻辑回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_23729557/article/details/125400187

版权

Sigmoid函数

$y=\frac{1}{1+e^{-z}}$
之所以选择sigmoid函数是因为在二分类任务中，如果单纯采用阶梯函数的话，其不连续及在 $z = 0$ 处不可导的性质为后续的优化带来麻烦，所以采用sigmoid函数作为一个替代。

对数几率回归模型推导

原理不再赘述，以西瓜书为基础（P59），对数几率回归的似然函数为
$\begin{aligned} l(w,b)&=\sum_{i=1}^{m}\ln p(y_i|x_i;w,b) \\ &=\sum_{i=1}^{m} \ln(y_ip_1(\hat{x_i;\beta}+(1-y_i)p_0(\hat{x_i};\beta))) \\ &=\sum_{i=1}^{m} \ln(y_i\frac{e^{\beta^T\hat{x_i}}}{1+e^{\beta^T\hat{x_i}}}+(1-y_i)\frac{1}{1+e^{\beta^T\hat{x_i}}}) \\ &=-\sum_{i=1}^{m} \ln((y_i-1)\frac{1}{1+e^{\beta^T\hat{x_i}}}-y_i\frac{e^{\beta^T\hat{x_i}}}{1+e^{\beta^T\hat{x_i}}}) \end{aligned}$
考虑 $y_1=0$ 和 $y_i=1$ 两种情况：

$y = 1$ 时：
$\begin{aligned} l(w,b)&=\sum_{i=1}^{m} (\beta^T\hat{x_i}-\ln(1+e^{\beta^T\hat{x_i}})) \end{aligned}$
$y = 0$ 时：
$\begin{aligned} l(w,b)&=\sum_{i=1}^{m} (-\ln(1+e^{\beta^T\hat{x_i}})) \end{aligned}$
综上， $l (w, b)$ 表示为：
$l(w,b)=\sum_{i=1}^{m} (y_i \beta^T\hat{x_i}-\ln(1+e^{\beta^T\hat{x_i}}))$

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
对数几率回归模型推导

西瓜书Sigmoid函数
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。