机器学习笔记——贝叶斯分类器（I）贝叶斯决策论

最新推荐文章于 2021-09-27 20:04:11 发布

王先生的副业

最新推荐文章于 2021-09-27 20:04:11 发布

阅读量431

点赞数

分类专栏：机器学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/uncle_gy/article/details/78991565

版权

机器学习同时被 2 个专栏收录

46 篇文章 3 订阅

订阅专栏

39 篇文章 5 订阅

订阅专栏

基本概念

贝叶斯决策论：

对于分类任务来说，在所有的相关概率都已知的理想情形下，贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。

基本原理

假设有 $N$ 中可能的类别标记，即 $\mathcal{Y}=\{c_1,c_2,\dots,c_N\}$ ， $\lambda_{ij}$ 是将一个真实标记为 $c_j$ 的样本误分类为 $c_i$ 所产生的损失。基于后验概率 $P(c_i\mid\mathbf{x})$ 可以获得将样本 $\mathbf{x}$ 分类为 $c_i$ 所产生的期望损失，即在样本 $\mathbf{x}$ 上的“条件风险”

R (c i ∣ x) = \sum j = 1 N λ i j P (c j ∣ x)

$R(c_i\mid\mathbf{x})=\sum_{j=1}^{N}\lambda_{ij}P(c_j\mid\mathbf{x})$

目标

找到一个判定准则 $h:\mathcal{X}\mapsto\mathcal{Y}$ 以最小化总体风险

R (h) = E x [R (h (x) ∣ x)]

$R(h)=\mathbb{E}_{\mathbf{x}}\left[R\left(h(\mathbf{x})\mid\mathbf{x}\right)\right]$

贝叶斯判定准则

为最小化总体风险，只需要在每个样本上选择那个可以使得条件风险 $R(c\mid\mathbf{x})$ 最小的类别标记。即：

h * (x) = arg min c \in Y R (c ∣ x)

$h^{*}(\mathbf{x})=\mathop{\arg\min}_{c\in\mathcal{Y}}R(c\mid \mathbf{x})$
此时

h∗ $h^{*}$ 被称为贝叶斯最优分类器，与之对应的总体风险

R(h∗) $R(h^{*})$ 被称为贝叶斯风险。

1−R(h∗) $1-R(h^{*})$ 反映了分类器所能达到的最好性能，即通过机器学习所能产生的模型精度的理论上限。

误判损失

若将误判损失写成：

λ i j = {01,, if i = j; otherwise

$\lambda_{ij}=\left\{\begin{aligned} 0&,&\text{if}\ i=j;\\ 1&,&\text{otherwise}\\ \end{aligned} \right.$
则此时条件风险为：

R (c ∣ x) = 1 - P (c ∣ x)

$R(c\mid\mathbf{x})=1-P(c\mid\mathbf{x})$
最小化分类错误率的贝叶斯最优分类器为：

h * (x) = arg max c \in Y P (c ∣ x)

$h^{*}(\mathbf{x})=\mathop{\arg\max}_{c\in\mathcal{Y}}P(c\mid\mathbf{x})$
即对于每个样本

x $\mathbf{x}$ 选择能够使得后验概率

P(c∣x) $P(c\mid\mathbf{x})$ 最大的类别标记。

贝叶斯公式和后验概率

利用贝叶斯判定准则来最小化决策风险，首先要获得后验概率 $P(c\mid\mathbf{x})$ ,但是这通常在现实任务中难以获得。

两种策略

判别式模型

给定 $\mathbf{x}$ ，可通过直接建模 $P(c\mid\mathbf{x})$ 来预测 $c$ 。

生成式模型

先对联合概率分布 $P(\mathbf{x},c)$ 建模，然后再由此获得 $P(c\mid\mathbf{x})$
可以使用贝叶斯公式：

P (c ∣ x) = P ( c ) P ( x ∣ c ) P ( x )

$P(c\mid\mathbf{x})=\dfrac{P(c)P(\mathbf{x}\mid c)}{P(\mathbf{x})}$

王先生的副业

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记——贝叶斯分类器（I）贝叶斯决策论

基本概念贝叶斯决策论：对于分类任务来说，在所有的相关概率都已知的理想情形下，贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。基本原理假设有NN中可能的类别标记，即Y={c1,c2,…,cN}\mathcal{Y}=\{c_1,c_2,\dots,c_N\}，λij\lambda_{ij}是将一个真实标记为cjc_j的样本误分类为cic_i所产生的损失。基于后
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。