[机器学习]贝叶斯分类器的最优性

最新推荐文章于 2024-04-27 16:07:13 发布

Bajo

最新推荐文章于 2024-04-27 16:07:13 发布

阅读量1.2k

点赞数

分类专栏：机器学习文章标签：机器学习算法概率论统计学

本文链接：https://blog.csdn.net/qq_34886635/article/details/113606849

版权

本文探讨了在有监督学习中是否存在最优分类器的问题，特别关注于贝叶斯分类器。通过Neyman-Pearson引理，分析了贝叶斯分类器的最优性质，证明了在确保犯第一类错误概率不变的情况下，贝叶斯分类器的错分率最小，从而证实了其最优性。

摘要由CSDN通过智能技术生成

贝叶斯分类器的最优性

提出问题:

对于有监督学习是否存在最优的分类器？我们从二分类的简单情况出发，利用Neyman-Pearson引理对这个问题进行分析.

分析问题:

1、假设检验

$(X_{1},Y_{1}),(X_{2},Y_{2}),\dots\dots(X_{n},Y_{n})\sim{}F(X,Y)$ ，给定 $X$ 预测对应的 $Y$ $H_{0}:\,Y=0\ vs\ H_{1}:\,Y=1\\ Y\sim\Pi\quad X|Y=0\sim f(X|Y=0)\quad X|Y=1\sim f(X|Y=1)$
2、分类器: $\delta(x)=\begin{cases}0&x\in R\\1&x\in R^{c}\end{cases}$
3、对应错分率 $L(d,y)=\begin{cases}0&d=y\\1&d\neq y\end{cases}\ \Rightarrow\ L(\delta(x),y)=\begin{cases}0&\delta(x)=y\\1&\delta(x)\neq y\end{cases}$
$E[L(\delta(X),Y)]=p(\delta(x)\ne y)$

问题准备:

1、Neyman-Pearson引理 $H_{0}:\,\theta=\theta_{0}\ vs\ H_{1}:\,\theta=\theta_{1}\ X_{1},X_{2},\dots\dots X_{n}\stackrel{\text{i.i.d}}{\sim}f(X|\theta)\quad L(\theta)=\prod^{n}_{i=1}f(X_{i}|\theta)$ $\delta(x)=\begin{cases}\theta_{0}& L(\theta_{0})/L(\theta_{1})\ge C\\\theta_{1}& L(\theta_{0})/L(\theta_{1})\le C\end{cases}\\ \ \\ \ \\ \alpha=P_{\theta_{0}}(\delta_{C}(x)=\theta_{1})$
(注意:此时 $\alpha$ 为检验的水平，N-P定理给定了最优分类器的形式)
那么此问题的目标就变成了寻找特定的C使得 $P(\delta(X)\neq Y)$ (错分率)最小.
此时，我们构造一个贝叶斯分类器 $\delta_{C_{B}}(x)=\begin{cases}0& \pi_{0}\,p(x|y=0)\,/\,\pi_{1}\,p(x|y=1)\ge 1\\1& \pi_{0}\,p(x|y=0)\,/\,\pi_{1}\,p(x|y=1)<1\end{cases}$
(注意:此处的 $\pi_{0}\,,\,\pi_{1}$ 为先验概率，可理解为随机有一个样本产生了，在不知道任何 $X$ 的信息下，它属于第一类或者第二类的概率,即 $p(Y=0)\,,\,p(Y=1)$

最低0.47元/天解锁文章

Bajo

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
[机器学习]贝叶斯分类器的最优性

贝叶斯分类器的最优性提出问题:对于有监督学习是否存在最优的分类器？我们从二分类的简单情况出发，利用Neyman-Pearson引理对这个问题进行分析.分析问题:1、假设检验(X1,Y1),(X2,Y2),……(Xn,Yn)∼F(X,Y)(X_{1},Y_{1}),(X_{2},Y_{2}),\dots\dots(X_{n},Y_{n})\sim{}F(X,Y)(X1,Y1),(X2,Y2),……(Xn,Yn)∼F(X,Y)，给定XXX预测对应的YYYH0: Y=0 vs&nb
复制链接

扫一扫

专栏目录