朴素贝叶斯算法知识要点

最新推荐文章于 2022-08-10 16:34:26 发布

tigerlib

最新推荐文章于 2022-08-10 16:34:26 发布

阅读量488

点赞数

分类专栏： machine learning 文章标签：朴素贝叶斯极大似然估计 arg max 贝叶斯估计

本文链接：https://blog.csdn.net/weixin_44695969/article/details/100004087

版权

18 篇文章 0 订阅

订阅专栏

$P(X=x|Y=c_k)=P(X^{(1)}=x^{(1)},X^{(2)}=x^{(2)},...,X^{(n)}=x^{(n)}|Y=c_k)=\prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y=c_k)$

这是一个较强的假设，由于这一假设，模型包含的条件概率的数量大为减少，朴素贝叶斯法的学习与预测大为简化。因而朴素贝叶斯法高效，且易于实现，其缺点是分类的性能不一定很高。

输入：训练数据集 $T=\{(x_{1},y_{1}),(x_{2},y_{2}),...(x_{N},y_{N})\}$ ，
- 其中 $x_i=(x_i^{(1)},x_i^{(2)},...x_i^{(j)},...,x_i^{(n)})^T$ ，
- $x_i^{(j)}$ 是第 $i$ 个样本的第 $j$ 个特征， $x_i^{(j)}\in\{a_{j1},a_{j2},...,a_{jl},...,a_{jS_j}\}$ ，
- $a_{jl}$ 是第 $j$ 个特征可能取值的第 $l$ 个值， $j = 1, 2, . . ., n$ ； $l=1,2,...,S_j$ ；
- $y_i\in\{c_1,c_2,..,c_K\}$ ；实例 $x$ ；
输出：实例 $x$ 的分类 $y$ 。

（1）计算先验概率及条件概率 $\to$ （极大似然估计）

$P(Y=c_k)=\frac{\sum_{i=1}^NI(y_i=c_K)}{N}，k=1,2,...,K$

$P(X^{(j)}=a_{jl}|Y=c_k)=\frac{\sum_{i=1}^NI(X^{(j)}=a_{jl},y_i=c_K)}{\sum_{i=1}^NI(y_i=c_K)}$ ， $k=1,2,...,K； j=1,2,...,n；l=1,2,...,S_j$

（2）对于给定的实例 $x=(x^{(1)},x^{(2)},...x^{(j)},...,x^{(n)})^T$ ，计算

$P(Y=c_k)\prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y=c_k)，k=1,2,...,K$

（3）确定实例 $x$ 的类

$y=\arg max_{c_k}P(Y=c_k)\prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y=c_k)，k=1,2,...,K$

例如函数 $F (x, y)$ :

$arg min_x F(x,y)$ 就是指当 $F (x, y)$ 取得最小值时，变量 $x$ 的取值；

$arg max_y F(x,y)$ 就是指当 $F (x, y)$ 取得最大值时，变量 $y$ 的取值。

关注