机器学习基础篇-逻辑回归和多分类问题

最新推荐文章于 2024-06-28 11:06:59 发布

Mr.Wiggles

最新推荐文章于 2024-06-28 11:06:59 发布

阅读量240

点赞数

分类专栏：机器学习基础文章标签：机器学习神经网络深度学习

本文链接：https://blog.csdn.net/Vihagle/article/details/118442893

版权

逻辑回归 sigmoid softmax回归损失函数多分类

关键词由CSDN通过智能技术生成

机器学习基础专栏收录该内容

31 篇文章 4 订阅

订阅专栏

Logistic Regression

定义：给定样本x的特征向量，输出为正样本时的概率 $p (y = 1 ∣ x)$ ，同时有负样本的概率为 $p (y = 0 ∣ x) = 1 - p (y = 1 ∣ x)$ 。在逻辑回归中，可学习的参数为W和b。

公式：
$p(y=1|x)=\sigma(W^Tx+b)=(1+e^{-W^Tx-b})^{-1}$

如下图所示，x轴为线性回归的值 $W^T+b$ ，y轴的值是x轴的值通过了sigmoid变换得到的 $p (y = 1 ∣ x)$
在这里插入图片描述

损失函数：
$L(\widehat{y}^i,{y}^i) = -[{y}^ilog\widehat{y}^i+(1-y^i)log(1-\widehat{y}^i)]$

$\widehat{y}^i$ 是预测值
${y}^i$ 是真实值

对于整个训练数据，有：
$J(W,b)=\frac{1}{m}\sum^m_{i=1}L(\widehat{y}^i,y^i)$

$m 为数据集的样本数$

综上所述，最小化损失函数即最大化样本发生的可能性。
由公式，样本发生的概率为
$LogLikelihood=\sum^m_{i=1}logP(y^i|x^i)=\sum_{i=1}^mlog(\widehat{y}^y(1-\widehat{y})^{1-y})=-\sum_{i=1}^mL(\widehat{y}^i,y^i)$

Multi-Class Classification (Softmax Regression)

在这里插入图片描述

softmax回归是逻辑回归（二分类）的一种推广，专门处理多分类问题。
在上图中，这是一个三分类的神经网络。最后一层是通过softmax激活函数进行转换输出，输出的值为每个class发生的概率。

softmax激活函数如下所示：
$\begin{aligned} &z^{|L|}=[z_0^{|L|},z_1^{|L|},z_2^{|L|}]\\ &a^{|L|}=[\frac{e^{z_0^{|L|}}}{e^{z_0^{|L|}}+e^{z_1^{|L|}}+e^{z_2^{|L|}}},\frac{e^{z_1^{|L|}}}{e^{z_0^{|L|}}+e^{z_1^{|L|}}+e^{z_2^{|L|}}},\frac{e^{z_2^{|L|}}}{e^{z_0^{|L|}}+e^{z_1^{|L|}}+e^{z_2^{|L|}}}]\\ &=[p(class=0|x),p(class=1|x),p(class=2|x)]\\ &=[y_0,y_1,y_2] \end{aligned}$