【数据挖掘】2. 贝叶斯分类器

叼辣条闯天涯

已于 2022-10-05 16:25:50 修改

阅读量520

点赞数

分类专栏：数据挖掘文章标签：数据挖掘机器学习人工智能

于 2022-09-24 16:45:14 首次发布

本博客原创文章未经允许不可用于商业盈利（包括以引流盈利的网站），纯非盈利性网站可在未经博主允许的情况下转载、使用非收费类博客，但请标明来源出处。

本文链接：https://blog.csdn.net/weixin_43529394/article/details/127027391

版权

数据挖掘专栏收录该内容

11 篇文章 9 订阅 ¥19.90 ¥99.00

订阅专栏

对于实例空间中一个固定的点 $p$ ，如果给定一个类标签 $c\in\mathcal{Y}$ ，如何确定下边的条件概率：
$Pr_{(x,y)\sim\mathcal{D}}[y=c|x=p]$
设计一个分类器 $h_{opt}$ 如下：
- 如果： $Pr_{(x,y)\sim\mathcal{D}}[y=-1|x=p] \ge 0.5$ ， $h_{opt} = -1$
- 否则， $h_{opt} = 1$
- $h_{opt}$ 的泛化误差 $err_{\mathcal{D}}(h_{opt})$ 被称为贝叶斯误差
- 个人认为 $Pr_{(x,y)\sim\mathcal{D}}[y=-1|x=p] \ge 0.5$ 等效于 $Pr_{(x,y)\sim\mathcal{D}}[y=-1|x=p] \ge Pr_{(x,y)\sim\mathcal{D}}[y=1|x=p]$
朴素贝叶斯分类
- 贝叶斯定理
  $\operatorname{Pr}[X \mid Y]=\frac{\operatorname{Pr}[Y \mid X] \cdot \operatorname{Pr}[X]}{\operatorname{Pr}[Y]}$
- 当 $\operatorname{Pr}[y=-1 \mid x] \geq \operatorname{Pr}[y=1 \mid x]$ 时，我们预测标签为 $- 1$
- 根据贝叶斯定理，可得：
  $Pr[y=1|x]=\frac{Pr[x|y=1]\cdot Pr[y=1]}{Pr[x]}$
  
  $Pr[y=-1|x]=\frac{Pr[x|y=-1]\cdot Pr[y=-1]}{Pr[x]}$
- 我们只需要计算 $Pr[x|y=1]\cdot Pr[y=1]$ 和 $Pr[x|y=-1]\cdot Pr[y=-1]$ 哪个更大，即可确定预测的标签，使用训练集估计它们。
  - 很容易得到 $P r [y = 1] = 0.3$
  - 对于 $P r [x ∣ y = 1]$ 将 $x$ 分解到每个属性上，假设：
    $\operatorname{Pr}[x \mid y=1]=\prod_{i=1}^d \operatorname{Pr}\left[x\left[A_i\right] \mid y=1\right]$
    
    对于没有出现的情况，比如 $P r [l a w yer ∣ y = 1]$ ，我们将其估计为很小的值，比如 0.000001
- 上边的贝叶斯分类器依赖于上述假设，即有条件独立（conditional independence）
使用不太严格的有条件独立，即假设一个属性固定时，其他的属性是独立的，例如对于：
$\boldsymbol{P r}[30+, \text { undergrad, programmer } \mid y=-1]$
假设，年龄和教育程度在固定职业时是独立的：
$\begin{aligned} & \operatorname{Pr}[30+, \text { undergrad, programmer } \mid y=-1] \\ =& \operatorname{Pr}[30+, \text { undergrad } \mid \text { programmer, } y=-1] . \\ & \operatorname{Pr}[\text { programmer } \mid y=-1] \\ =& \operatorname{Pr}[30+\mid \text { programmer, } y=-1] \\ & \cdot \operatorname{Pr}[\text { undergrad } \mid \text { programmer, } y=-1] \\ & \cdot \operatorname{Pr}[\text { programmer } \mid y=-1] \\ =& \frac{2}{4} \cdot \frac{1}{4} \cdot \frac{4}{7}=1 / 14 . \end{aligned}$

叼辣条闯天涯

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
2
评论
【数据挖掘】2. 贝叶斯分类器

上边的贝叶斯分类器依赖于上述假设，即有条件独立（conditional independence）哪个更大，即可确定预测的标签，使用训练集估计它们。，我们将其估计为很小的值，比如 0.000001。对于实例空间中一个固定的点。对于没有出现的情况，比如。，如果给定一个类标签。
复制链接

扫一扫