贝叶斯决策理论

最新推荐文章于 2024-07-27 10:31:18 发布

zhfplay

最新推荐文章于 2024-07-27 10:31:18 发布

阅读量998

点赞数

分类专栏：机器学习算法文章标签：决策论贝叶斯决策风险奈曼-皮尔逊准则

本文链接：https://blog.csdn.net/zhfplay/article/details/90301579

版权

本文详细介绍了贝叶斯决策理论，包括奈曼-皮尔逊准则、贝叶斯准则和最小化风险准则。通过对二分类混淆矩阵、ROC曲线和错误率的探讨，阐述了如何在统计决策中权衡风险和错误率，以找到最优决策函数。同时，文章还扩展到多类别决策的情况。

摘要由CSDN通过智能技术生成

贝叶斯决策理论

一、简介

假设我们有一个样本（特征向量），用 $X$ 表示。我们的总体被分为 $g$ 个类别，记为 $w_k (k=1,\dots g)$ .

决策准则是一个函数，记为 $\delta:\mathbb{R}^p \to \mathcal A$ ，其中 $\mathcal A = \{a_1,\dots,a_c\}$ . 这里的 $\mathcal A$ 我们称之为操作空间，或者操作集合，也就是说是我们通过决策函数之后所需要采取的动作。

我们希望能够在某个特定的准则之下得到最优的决策函数。在这篇文章中，我们只考虑只有一个特征的样本，即 $p = 1$ .

二、奈曼-皮尔逊准则

1.定义

假设样本只有两个类别，即 $\mathcal A=(a_1,a_2)$ .

对 $w_k$ 的条件概率密度函数： $f_k(x)=f(x\mid w_k)$

在 $w_k$ 类中 $X$ 属于某一个区间的概率： $\int_a^b f_k(x)dx=\mathbb P(X \in [a,b]\mid Z=w_k)$

决策函数现在可以定义为：
$\delta(x)=\left\{\begin{array}{ll}{a_{1}} & {\text { if } x \in \mathcal{R}_{1}} \\ {a_{2}} & {\text { if } x \in \mathcal{R}_{2}}\end{array}\right.$
这里的 $\mathcal R_1,\mathcal R_2$ 是决策区域。

这样，我们可以定义两类错误：属于 $w_1$ 的样本被采取动作 $a_2$ 和属于 $w_2$ 的样本被采取动作 $a_1$ ：
$\begin{aligned} \alpha &=\mathbb{P}\left(\delta(X)=a_{2} | Z=\omega_{1}\right)=\int_{\mathcal{R}_{2}} f_{1}(x) dx \\ \beta &=\mathbb{P}\left(\delta(X)=a_{1} | Z=\omega_{2}\right)=\int_{\mathcal{R}_{1}} f_{2}(x) dx \end{aligned}$
从下面的图中我们可以清晰地看出 $\alpha$ 和 $\beta$ 的定义。

在这里插入图片描述
如果从Sensibility和Specificity的角度来说， $\alpha = 1-Specificity, \beta = 1- Sensibility$ . 具体的定义请看下一节。

2. 二分类混淆矩阵（Confusion matrix g=2）

在机器学习中，混淆矩阵是一种常用的用来评价算法性能的可视化方法。下面我们来看看二分类问题下的混下矩阵。
真假表示样本的真是类别，阴阳表示决策函数预测的样本类别。

	Positive 阳	Negtive 阴
True 真	TP 真阳例	FN 假阴例
False 假	FP 假阳例	TN 真阴例

从这张表，我们可以定义出几个常用而又容易混淆的率：
$\begin{aligned} 错误率(Error\ rate) &= \frac{FN+FP}{TP+FN+FP+TN}\\ \\ 准确率(Accuracy) &= \frac{TP+TN}{TP+FN+FP+TN}\\ \\ 查准率(Precision精确度)&=\frac{TP}{TP+FP}\\ \\ 查全率(Recall\ rate召回率)&=\frac{TP}{TP+FN}\\ \\ TPR(True\ positive\ rate) &=\frac{TP}{TP+FN}\qquad(Sensitivity)\\ \\ FPR(False\ positive\ rate)&=\frac{FP}{FP+TN}\qquad(1-Specificity)\\ \\ F1-Score &= \frac{2*Precision*Recall}{Precision*Recall} \end{aligned}$