统计学习方法第四章

最新推荐文章于 2022-04-03 11:32:41 发布

a97155787

最新推荐文章于 2022-04-03 11:32:41 发布

阅读量52

点赞数

分类专栏：统计学习方法文章标签：朴素贝叶斯极大似然估计条件概率贝叶斯估计分类

本文链接：https://blog.csdn.net/a97155787/article/details/119004775

版权

统计学习方法专栏收录该内容

5 篇文章 0 订阅

订阅专栏

朴素贝叶斯法

设输入空间 $\mathcal{X} \subseteq \mathbf{R}^{n}$ 为 $n$ 维向量的集合, 输出空间为类标记集合 $\mathcal{Y}=$ $\left\{c_{1}, c_{2}, \cdots, c_{K}\right\}$ 。输入为特征向量 $\in \mathcal{X}$ , 输出为类标记（class label） $\in \mathcal{Y}_{\circ} X$ 是定义在输入空间 $\mathcal{X}$ 上的随机向量, $Y$ 是定义在输出空间 $\mathcal{Y}$ 上的随机变量。 $P (X, Y)$ 是 $X$ 和 $Y$ 的联合概率分布。

$c_{i}$ : $Y$ 的集合中的元素

假设 $x^{(j)}$ 可取值有 $S_{j}$ 个

第 $j$ 个特征 $x^{(j)}$ 可能取值的集合为 $\left\{a_{j 1}, a_{j 2}, \cdots, a_{j S_{j}}\right\}$

$a_{j l}$ 是第 $j$ 个特征可能取的第 $l$ 个值

极大似然估计

先验概率
- $P\left(Y=c_{k}\right)=\frac{\sum_{i=1}^{N} I\left(y_{i}=c_{k}\right)}{N}, \quad k=1,2, \cdots, K$
条件概率
- $P\left(X^{(j)}=a_{j l} \mid Y=c_{k}\right)=\frac{\sum_{i=1}^{N} I\left(x_{i}^{(j)}=a_{j l}, y_{i}=c_{k}\right)}{\sum_{i=1}^{N} I\left(y_{i}=c_{k}\right)}$
  $\cdots, n ; \quad l=1,2, \cdots, S_{j} ; \quad k=1,2, \cdots, K$
判断类
- $y=\arg \max _{c_{k}} P\left(Y=c_{k}\right) \prod_{j=1}^{n} P\left(X^{(j)}=x^{(j)} \mid Y=c_{k}\right)$

贝叶斯估计

先验概率
- $P_{\lambda}\left(Y=c_{k}\right)=\frac{\sum_{i=1}^{N} I\left(y_{i}=c_{k}\right)+\lambda}{N+K \lambda}$
条件概率
- $P_{\lambda}\left(X^{(j)}=a_{j l} \mid Y=c_{k}\right)=\frac{\sum_{i=1}^{N} I\left(x_{i}^{(j)}=a_{j l}, y_{i}=c_{k}\right)+\lambda}{\sum_{i=1}^{N} I\left(y_{i}=c_{k}\right)+S_{j} \lambda}$
判断类
- $y=\arg \max _{c_{k}} P\left(Y=c_{k}\right) \prod_{j=1}^{n} P\left(X^{(j)}=x^{(j)} \mid Y=c_{k}\right)$

贝叶斯估计补充：

验证其为概率分布
- $P_{\lambda}\left(X^{(j)}=a_{j l} \mid Y=c_{k}\right)>0$
  $\sum_{l=1}^{S_{j}} P\left(X^{(j)}=a_{j l} \mid Y=c_{k}\right)=1$
${\lambda>0}$
$S_{j}$ $x^{(j)}$ 可取值的数量

a97155787

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法第四章

朴素贝叶斯法设输入空间 X⊆Rn\mathcal{X} \subseteq \mathbf{R}^{n}X⊆Rn 为 nnn 维向量的集合, 输出空间为类标记集合 Y=\mathcal{Y}=Y= {c1,c2,⋯ ,cK}\left\{c_{1}, c_{2}, \cdots, c_{K}\right\}{c1,c2,⋯,cK} 。输入为特征向量 x∈Xx \in \mathcal{X}x∈X, 输出为类标记（class label） y∈Y∘Xy \in \mathcal{Y}_{\circ}
复制链接

扫一扫