[机器学习]贝叶斯分类器I

最新推荐文章于 2024-08-04 03:12:33 发布

3points

最新推荐文章于 2024-08-04 03:12:33 发布

阅读量581

点赞数

分类专栏：机器学习文章标签：机器学习分类人工智能

本文链接：https://blog.csdn.net/m0_45164809/article/details/121309843

版权

机器学习专栏收录该内容

11 篇文章 1 订阅

订阅专栏

贝叶斯分类器I

贝叶斯决策论

贝叶斯决策论实在概率框架下实施决策得基本方法。

对分类任务来说，在所有相关概率都已知得理想情况下，贝叶斯决策论考虑如何基于这些概率和误判损失选择最优得类别标记。

问题：

假设有 $N$ 种可能得类别标记，即 $y=\left \{ c_1,c_2,\cdots,c_N \right \}$ ， $\lambda_{ij}$ 为将一个真实标记为 $c_i$ 的样本误标记为 $c_j$ 所产生的损失.

条件风险： $R(c_i|x)=\sum_{N}^{j=1}\lambda_{ij}P(c_j|x)$
目标：于是我们的任务便是寻找一个判定准则 $\longrightarrow y$ 以最小化总体风险： $R(h)=E_x\left [ R(h(x)|x) \right ]$
结果： $h^*(x)={argmin}_{c\in y }R(c|x)$ ， $h^*(x)$ 称为贝叶斯最优分类器。

若记 $\lambda_{ij}=\left\{\begin{matrix} 0,i=j \\ 1,i\ne j \end{matrix}\right.$ ，则条件风险 $R (c ∣ x) = 1 - P (c ∣ x)$ ，贝叶斯最优分类器为 $h^*(x)={argmax}_{c\in y }P(c|x)$ 。

于是问题转化为估计 $P (c ∣ x)$ ，由贝叶斯定理 $P(c|x)=\frac{P(c)P(x|c)}{P(x)}$ 。
在这里插入图片描述

朴素贝叶斯分类器

朴素贝叶斯分类器(naive Bayes classifier)采用了“属性条件独立性假设”：对已知类别，假设所有属性相互独立。

目标函数

$\begin{matrix} P(c|x)=\frac{P(c)P(x|c)}{P(x)}=\frac{P(c)}{P(x)}\prod_{i=1}^{d}P(x_i|c) \\ \\ h_{nb}(x)={argmax}_{{c\in y }}P(c)\prod_{i=1}^{d}P(x_i|c) \end{matrix}$

求解

先验概率： $P(c)=\frac{\left | D_c \right | }{\left | D \right | }$
条件概率：

离散属性：令 $D_{c,x_i}$ 表示 $D_c$ 中在第 $i$ 个属性上取值为 $x_i$ 的样本组成的集合，则： $P(x_i|c)=\frac{\left | D_{c,x_i} \right | }{\left | D_c \right | }$
连续属性：考虑概率密度函数，假定 $p(x_i|c)\sim N(\mu_{c,i},\sigma_{c,i}^2)$ ，则： $P(x_i|c)=\frac{1}{\sqrt{2\pi}\sigma_{c,i}}exp(-\frac{(x_i-\mu_{c,i})^2}{2\sigma_{c,i}^2} )$

补充

为避免其他属性携带信息被训练集中未出现的属性值抹去，在估计概率时通常要进行平滑，常用拉普拉斯修正：
$\begin{matrix} \hat{P}(c)=\frac{\left | D_c \right |+1 }{\left | D \right |+N } \\ \\ \hat{P}(x_i|c)= \frac{\left | D_{c,x_i} \right |+1 }{\left | D_c \right |+N_i } \end{matrix}$

半朴素贝叶斯分类器

半朴素贝叶斯分类器适当考虑一部分属性间的相互依赖信息，从而既不需要进行完全联合概率计算，又不至于彻底忽略了比较强的属性依赖关系。

独依赖估计（ODE）

假设每个属性在类别之外最多依赖于一个其他属性，即 $P(c|x)\propto P(c)\prod_{i=1}^{d}P(x_i|c,pa_i)$

根据属性与其父节点的连接关系，有以下几种分类：

SPODE
TAN
AODE

3points

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[机器学习]贝叶斯分类器I

贝叶斯分类器I贝叶斯决策论问题：朴素贝叶斯分类器目标函数求解补充半朴素贝叶斯分类器独依赖估计（ODE）贝叶斯决策论贝叶斯决策论实在概率框架下实施决策得基本方法。对分类任务来说，在所有相关概率都已知得理想情况下，贝叶斯决策论考虑如何基于这些概率和误判损失选择最优得类别标记。问题：假设有NNN种可能得类别标记，即 y={c1,c2,⋯ ,cN}y=\left \{ c_1,c_2,\cdots,c_N \right \}y={c1,c2,⋯,cN}，λij\lambda_{ij}λij为将一个
复制链接

扫一扫

专栏目录