数学建模常见算法的通俗理解（3）

最新推荐文章于 2024-06-15 16:17:24 发布

菜只因C

最新推荐文章于 2024-06-15 16:17:24 发布

阅读量879

点赞数 25

分类专栏：数学建模论文手教程文章标签：数学建模算法

本文链接：https://blog.csdn.net/m0_71934846/article/details/135828852

版权

数学建模论文手教程专栏收录该内容

8 篇文章 0 订阅

订阅专栏

11 Logistic模型（计算是/否的概率）

11.1 粗浅理解

我们有m张图片，并且获取了这些图片的特征向量的矩阵，我们需要判断这些图片中是否满足我们某个要求，如是否含有猫🐱这种动物。那么此时我们的每张图片传进模型后的输出就是一个概率。因为概率的大小都是趋于0到1之间的，此时我们就不能利用简单的线性回归来作为输出。我们可以考虑使用logistic回归。logistic回归函数的参数也是一个大小为n的向量，它可以看成是对应每个像素的权重，并且还含有一个b的标量表示偏移。而要实现逻辑回归就需要控制y的输出位于0到1之间，这里利用的方法是使用sigmoid函数，它可以将输出y控制到0-1之间，sigmoid函数如下：

它的函数表达式是：

我们可以看到这个函数将输出控制在0-1之间。此时我们的logistic回归的表达式就是：

损失函数和代价函数：
上面我们讨论了logistic回归，我们的目的是要使用这个回归来得到预测输出y，但是我们知道，我们需要一个标准来衡量我们的输出是否好，即训练值中的输出和预测是否一致。而这个衡量标准就是损失函数。对于单个样本，我们定义一个函数loss来计算真实值和预测值的误差：loss=ylog(y^)+(1−y)log(1−y^)

当然，你也可以定义一些别的函数作为损失函数，比如就是我们常见的表示数据之间拟合度的函数，不过这些函数会在后面我们拟合时不好拟合，所以我们选择了之前的损失函数。

我们之前使用的loss损失函数只能说是某个样本的拟合情况，而我们需要统计的是对于整个数据集中对应的所有数据的损失函数，我们利用符号J来表示这个函数，这个函数叫做代价函数。J就直接与我们需要训练的W和b相关：

梯度下降法：
之前我们看了代价函数J，我们的目的是需要让它能够变得最少。我们采用的方法就是梯度下降法，即通过求导数的方式将其一步步变化以达到最优解。而我们对于两个变量w和b的处理方式是