Google---机器学习速成课程(九)- 逻辑回归 (Logistic Regression)

最新推荐文章于 2021-07-26 11:21:45 发布

weixin_39223665

最新推荐文章于 2021-07-26 11:21:45 发布

阅读量266

点赞数

分类专栏： Google_ML

Google_ML 专栏收录该内容

14 篇文章 4 订阅

订阅专栏

逻辑回归 (Logistic Regression)

逻辑回归会生成一个介于 0 到 1 之间（不包括 0 和 1）的概率值，而不是确切地预测结果是 0 还是 1。以用于检测垃圾邮件的逻辑回归模型为例。如果此模型推断某一特定电子邮件的值为 0.932，则意味着该电子邮件是垃圾邮件的概率为 93.2%。更准确地说，这意味着在无限训练样本的极限情况下，模型预测其值为 0.932 的这组样本实际上有 93.2% 是垃圾邮件，其余的 6.8% 不是垃圾邮件。

学习目标

了解逻辑回归。
了解逻辑回归的损失和正则化函数。

-------------------------------------------------------

逻辑回归 (Logistic Regression)：计算概率

许多问题需要将概率估算值作为输出。逻辑回归是一种极其高效的概率计算机制。实际上，您可以通过下两种方式之一使用返回的概率：

“按原样”
转换成二元类别。

我们来了解一下如何“按原样”使用概率。假设我们创建一个逻辑回归模型来预测狗在半夜发出叫声的概率。我们将此概率称为：

p(bark | night)

如果逻辑回归模型预测 p(bark | night) 的值为 0.05，那么一年内，狗的主人应该被惊醒约 18 次：

startled = p(bark | night) * nights 18 ~= 0.05 * 365

在很多情况下，您会将逻辑回归输出映射到二元分类问题的解决方案，该二元分类问题的目标是正确预测两个可能的标签（例如，“垃圾邮件”或“非垃圾邮件”）中的一个。之后的单元会重点介绍这一内容。

您可能想知道逻辑回归模型如何确保输出值始终落在 0 和 1 之间。巧合的是，S 型函数生成的输出值正好具有这些特性，其定义如下：

S 型函数会产生以下曲线图：

图 1：S 型函数。

如果 z 表示使用逻辑回归训练的模型的线性层的输出，则 S 型(z) 函数会生成一个介于 0 和 1 之间的值（概率）。用数学方法表示为：

图 2：逻辑回归输出

假设我们的逻辑回归模型具有学习了下列偏差和权重的三个特征：

b = 1
w₁ = 2
w₂ = -1
w₃ = 5

进一步假设给定样本具有以下特征值：

x₁ = 0
x₂ = 10
x₃ = 2

因此，对数几率：

为：  (1) + (2)(0) + (-1)(10) + (5)(2) = 1

因此，此特定样本的逻辑回归预测值将是 0.731：

-------------------------------------------------------

逻辑回归的损失函数

线性回归的损失函数是平方损失。逻辑回归的损失函数是对数损失函数，定义如下：

其中：

(x,y) & straightepsilon; D 是包含很多有标签样本 (x,y) 的数据集。
“ y ”是有标签样本中的标签。由于这是逻辑回归，因此“ y ”的每个值必须是 0 或 1。
“ y' ”是对于特征集“ x ”的预测值（介于 0 和 1 之间）。

对数损失函数的方程式与 Shannon 信息论中的熵测量密切相关。假设“y”属于伯努利分布，它也是似然函数的负对数。实际上，最大限度地降低损失函数的值会生成最大的似然估计值。

-------------------------------------

逻辑回归中的正则化

正则化在逻辑回归建模中极其重要。如果没有正则化，逻辑回归的渐近性会不断促使损失在高维度空间内达到 0。因此，大多数逻辑回归模型会使用以下两个策略之一来降低模型复杂性：

L₂ 正则化。
早停法，即，限制训练步数或学习速率。

（我们会在之后的单元中讨论第三个策略 - L₁ 正则化。）

假设向每个样本分配一个唯一 ID，且将每个 ID 映射到其自己的特征。如果未指定正则化函数，模型会变得完全过拟合。这是因为模型会尝试促使所有样本的损失达到 0 但始终达不到，从而使每个指示器特征的权重接近正无穷或负无穷。当有大量罕见的特征组合且每个样本中仅一个时，包含特征组合的高维度数据会出现这种情况。

幸运的是，使用 L₂ 或早停法可以防止出现此类问题。

总结

逻辑回归模型会生成概率。
对数损失函数是逻辑回归的损失函数。
逻辑回归被很多从业者广泛使用。

-------------------------------------------------------

以上整理转载在谷歌出品的机器学习速成课程点击打开链接侵删！

weixin_39223665

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

weixin_39223665 CSDN认证博客专家 CSDN认证企业博客

码龄7年

40: 原创

39万+: 周排名

72万+: 总排名

91万+: 访问

: 等级

3239: 积分

59: 粉丝

243: 获赞

58: 评论

632: 收藏

私信

关注

分类专栏

matlab 8篇
cs231n 9篇
python 21篇
bayes
Google_ML 14篇
GAN 1篇
深度学习 2篇
tips 1篇
剑指offer-python 10篇

最新评论

Matlab 将cell转换成double格式
丿双月鸟er: 确实，改成这样是对的
matlab中的complex double 与double
QuChongqi: 不知道什么情况，用double数据求反正弦后变成了complex double数据。具体是什么原因，有人可以解释一下吗
matlab中的complex double 与double
深夜鳕鱼堡: 您好，你的问题解决了吗，我也遇到了相似的问题
matlab中的complex double 与double
ggzjc: double与complex double怎么转换？问题:T的值512*512*3complex double F的值512*1536double A=T.*F运行则会报错报错情况:二进制数组操作的数组维度必须匹配这个问题怎么解决呢
Matlab 将cell转换成double格式
路边风景也很美！: 没用呀

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。