李宏毅DL课程学习-Logistic Regression

最新推荐文章于 2024-09-25 12:32:51 发布

wechatNO

最新推荐文章于 2024-09-25 12:32:51 发布

阅读量231

点赞数 1

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37870385/article/details/106407783

版权

本文所有图片出自李老师课程PPT

针对之前的分类问题，我们通过计算所有样本的后验概率来评价所得模型的好坏 $L (w, b)$
在这里插入图片描述
所以我们最大化来获得最佳的 $w^*, b^*$ （概率问题一般可以转换为log函数进行求解）

通过引入 $\hat y^i$ 变量，我们可以将公式抽象成求和的形式：

从而我们可以得到分类的问题的 $L o s s F u n c t i o n$ ，形式为概率的交叉熵。
在这里插入图片描述

通过求偏导数可以获得参数更新：

对比线性回归模型：

其中，逻辑回归不能采用sqaure error来衡量的原因是偏导在远离真实解的地方仍为零：

判断模型与通用模型回归的不同之处在于在discirminative中对distribution不存在假设，generative中存在类似高斯的分布假设。
在这里插入图片描述
所以discriminative受data影响较大，贝叶斯回归是通用模型，逻辑回归是判别模型

引申到多分类问题时，常用到 $S o f t m a x$ 函数，可以拉大原始值之间的差距，

当原始特征空间上难以通过逻辑回归找到一条直线将数据点分开，则需要对特征进行变换，可以通过多层逻辑回归来实现，也就是神经元的概念。
在这里插入图片描述

$S o f t m a x 与 S i g m o i d$ 参考资料

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。