深度学习系列2：聊聊逻辑回归

最新推荐文章于 2024-06-30 13:47:00 发布

haoyutiangang

最新推荐文章于 2024-06-30 13:47:00 发布

阅读量379

点赞数

分类专栏：机器学习深度学习文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haoyutiangang/article/details/104987262

版权

本文介绍了逻辑回归的基本概念，作为从线性回归到深度学习的过渡。内容包括逻辑回归的作用、Sigmoid函数的引入、损失函数的选用（交叉熵）、以及正向传播和反向传播在求解逻辑回归过程中的应用。通过梯度下降法更新参数，最终实现对二分类问题的预测。

摘要由CSDN通过智能技术生成

在这里插入图片描述

引言

在线性回归中，输出是连续的。而在逻辑回归中，输出非 A 即 B，解决的是二分类的问题。比如某套房子是否适合购买，明天是否有雨等。

逻辑回归

线性回归的输出是连续的，如果要预测二分类选择问题，线性回归就不好满足了。比如预测某套房子是否适合购买，通过如下的数据如何建立模型呢？

在这里插入图片描述

回顾线性回归的方程：

$Y_{1m} = W_{1n} * X_{nm} + b$

其中：

$n$ 表示变量维度
$m$ 表示样本个数
$X$ 表示变量矩阵
$W$ 表示权重矩阵
b 表示偏移量

线性回归的输出 Y 是连续的，如何才能把结果改造成逻辑回归要求的非 A 即 B，非 0 即 1 呢？

首先想到的是利用阶跃函数:

在这里插入图片描述

$\begin{aligned} u(x)= \begin{cases} 0& \text{x<0}\\ 1& \text{x>=0} \end{cases} \end{aligned}$

阶跃函数是一个分段函数，当变量小于 0 时结果为 0，当变量大于等于 0 时结果为 1。

使用阶跃函数确实可以把输出固定为 0 或 1，但运算求解就比较麻烦了，因为阶跃函数是分段函数，不是连续可导的函数。

那有没有一个既连续可导又类似阶跃函数的函数呢，还真有，就是下面这个 sigmoid 函数:

在这里插入图片描述

$\frac 1 {1+e^{-x}}$

可以看到，Sigmoid 函数不仅连续可导，并且随着变量的变化，在 y 轴两侧很快就趋近于 0 或 1 了。

所以我们在线性回归的基础上加上一层 Sigmoid 函数即可得到逻辑回归的方程：

$Y_{1m} = Sigmoid(W_{1n} * X_{nm} + b)$

逻辑回归的损失函数

和线性回归一样，我们仍然希望方程预测的值 $\hat Y$ 与真值 $Y$ 差异越小越好，需要给出表示误差大小的损失函数。

逻辑回归的损失函数和线性回归中有所不同。

因为对于逻辑回归而言，线性回归损失函数的形式 $\fr$

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习系列2：聊聊逻辑回归

引言在线性回归中，输出是连续的。而在逻辑回归中，输出非 0 即 1，解决的是二分类的问题。比如某套房子是否适合购买，明天是否有雨等。逻辑回归回顾线性回归的方程：Y1m=W1n∗Xnm+bY_{1m} = W_{1n} * X_{nm} + bY1m=W1n∗Xnm+b其中：nnn 表示变量维度mmm 表示样本个数XXX 表示变量矩阵WWW 表示权重矩阵b 表示偏移...
复制链接

扫一扫

专栏目录

haoyutiangang CSDN认证博客专家 CSDN认证企业博客

码龄9年

79: 原创

4万+: 周排名

181万+: 总排名

13万+: 访问

: 等级

2078: 积分

188: 粉丝

165: 获赞

31: 评论

647: 收藏

私信

关注

热门文章

分类专栏

决策树 7篇
Hadoop实战 4篇
ZooKeeper
Flume 1篇
Kafka 2篇
Storm 2篇
项目基础 2篇
Hive 3篇
Java 2篇
Spark 1篇
算法 14篇
LeetCode 14篇
机器学习 48篇
深度学习 41篇
吴恩达 34篇

最新评论

深度学习系列6：卷积神经网络的反向传播
提莫队长刘谢文: 兄弟，请问解决了吗？是直接相加吗？
吴恩达Coursera深度学习课程 deeplearning.ai (4-4) 人脸识别和神经风格转换--编程作业
自向阳_: def compute_layer_style_cost(a_S, a_G): """ Arguments: a_S -- tensor of dimension (1, n_H, n_W, n_C), hidden layer activations representing style of the image S a_G -- tensor of dimension (1, n_H, n_W, n_C), hidden layer activations representing style of the image G Returns: J_style_layer -- tensor representing a scalar value, style cost defined above by equation (2) """ ### START CODE HERE ### # Retrieve dimensions from a_G (≈1 line) m, n_H, n_W, n_C = a_G.get_shape().as_list() # Reshape the images to have them of shape (n_C, n_H*n_W) (≈2 lines) a_S = tf.transpose(tf.reshape(a_S, [n_H * n_W, n_C])) a_G = tf.transpose(tf.reshape(a_G, [n_H * n_W, n_C])) # Computing gram_matrices for both images S and G (≈2 lines) GS = gram_matrix(a_S) GG = gram_matrix(a_G) # Computing the loss (≈1 line) J_style_layer = (1 / (2 * n_C * n_W * n_H) ** 2) * (tf.reduce_sum(tf.square(tf.subtract(GS, GG)))) ### END CODE HERE ###
深度学习系列6：卷积神经网络的反向传播
AgileFastx: 请问对于多filter的情况如何求dA
决策树系列3：信息增益、增益率、基尼系数 (史上最详尽)
Artemisia_Cain: 这里信息增益的举例算错了吧，应该是Ent(X|场地=室外)后面不应该是logbase2吗？log()这怎么直接用的lg来算啊，lg(1/2)才是0.3010。
吴恩达Coursera深度学习课程 deeplearning.ai (4-4) 人脸识别和神经风格转换--编程作业
qq_43724777: The Session graph is empty. Add operations to the graph before calling run().

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。