理解逻辑回归中的后验概率和损失函数

最新推荐文章于 2022-10-29 17:43:18 发布

Paul-LangJun

最新推荐文章于 2022-10-29 17:43:18 发布

阅读量1.7k

点赞数 2

分类专栏：机器学习概率与统计文章标签： sigmod 逻辑回归后验概率损失函数

本文链接：https://blog.csdn.net/gaoxueyi551/article/details/103735274

版权

机器学习同时被 2 个专栏收录

35 篇文章 4 订阅

订阅专栏

概率与统计

21 篇文章 0 订阅

订阅专栏

一、理解后验概率

在LR中，后验概率 $\small p\left ( y=1|\textbf{x} \right )=\sigma \left ( \textbf{w}^T\textbf{x}+b \right )$ 。很多人不禁会问，为什么要这么计算？这里通过对后验概率的推导，并结合sigmod，来谈谈自己的看法。

首先，由贝叶斯公式得

$\large p\left ( y=1|\textbf{x} \right )=\frac{p\left ( \textbf{x}|y=1 \right )p\left ( y=1 \right )}{p\left ( \textbf{x} \right )}$ (1)

由全概率公式得

$\large p\left ( y=1|\textbf{x} \right )=\frac{p\left ( \textbf{x}|y=1 \right )p\left ( y=1 \right )}{p\left ( \textbf{x}|y=1 \right )p\left ( y=1 \right )+p\left ( \textbf{x}|y=0 \right )p\left ( y=0 \right )}$ (2)

化简 (2) 式得

$\large p\left ( y=1|\textbf{x} \right )=\frac{1}{1+{\color{Blue} \frac{p\left ( y=0|\textbf{x} \right )}{p\left ( y=1|\textbf{x} \right )}}}$ (3)

(3) 式在LR中的表示为

$\large p\left ( y=1|\textbf{x} \right )=\frac{1}{1+{\color{Blue} exp^{-\left ( \textbf{w}^{T}\textbf{x}+b \right )}}}$ (4)

(3) 式分母第二项表达的意思是 $\large \textbf{x}$ 分到两个类的概率之比，那究竟是分到1的类别大还是分到0的概率大？简单来说便是该如何量化的问题。因此，(4) 式分母中的第二项就给出了一种合理的量化分法，可以分三种情况讨论一下这个问题。

1、 $\textbf{x}$ 刚好落在 $\textbf{w}^{T}\textbf{x}+b$ 决定的分类边界上。此时 (4) 中分母的第二子项的值为 1，分到两个类别的概率是相同的，(3) 中分母第二子项的值也应该为 1。

2、 $\textbf{x}$ 落在 $\textbf{w}^{T}\textbf{x}+b$ 决定的分类边界的上方。此时 (4) 中分母的第二子项的值会小于1，sigmod值大于 0.5，因此我们认为 $\textbf{x}$ 属于 1 分类的概率更大一些，对应到 (3) 式分母的第二个子项，应该是分母应该比分子要大。

3、 $\textbf{x}$ 落在 $\textbf{w}^{T}\textbf{x}+b$ 决定的分类边界的下方。此时 (4) 中分母的第二子项的值大于1，sigmod值小于 0.5，因此我们认为 $\textbf{x}$ 属于0 分类的概率会更大一些。对应到 (3) 式分母的第二个子项，应该是分母应该比分子要小。此时将样本 $\textbf{x}$ 分错了，后面会介绍对此的惩罚。