(二)朴素贝叶斯分类器_朴素贝叶斯输出是什么样子的-CSDN博客

本文链接：https://blog.csdn.net/weixin_43667730/article/details/124068564

(二)朴素贝叶斯分类器

由(一)朴素贝叶斯与贝叶斯分类器基础知识进行拓展. 设输入空间是 $n$ 维的类别向量 $X={x_1,…,x_n}$ , 输出空间的类别有 $K$ 类: $Y={c_1,…,c_K}$ . $X$ 是输入空间 $X$ 上的随机变量, $Y$ 是输出空间 $Y$ 上的随机变量. 训练数据集 $D$ 为 ${(x_1,y_1 ),…,(x_N,y_N )}$ , $y$ 为标签.

贝叶斯分类器的输出问题是给定一系列输入 $X={x_1,…,x_n}$ , 算出这个输入属于各个类别的概率, 最大概率处就是这个输入的类别. 即需要算出所有的 $P(Y=c_k│X),k=1,…,K$ .

由贝叶斯公式 $P(A|B)=P(A)\dfrac{P(B|A)}{P(B)}$ , $P(C|D)=P(C_1 |A)…P(C_m |A)$ , $P(B)=∑_{i=1}^nP(A_i )P(B|A_i )$ , 则有:
$\begin{aligned} P(Y=c_k│X) &= P(Y=c_k )\dfrac{P(X|Y=c_k )}{P(X)} \\ &= P(Y=c_k )\dfrac{(P(x_1│Y=c_k )×…×P(x_n│Y=c_k )}{P(Y=c_k )P(x_1 |Y=c_k )+⋯+P(Y=c_k )P(x_n |Y=c_k )} \\ &= P(Y=c_k )\dfrac{(∏_{j=1}^nP(x_j│Y=c_k ) }{∑_{k=1}^KP(Y=c_k ) ∏_{j=1}^nP(x_j│Y=c_k ) } \end{aligned}$

至此, 每一个 $P(Y=c_k│X)$ 都算出来了, 这个输入 $X$ 的类别也就被分类了.
{值得注意的是, 朴素贝叶斯朴素就朴素在假设 $x_1,…,x_n$ 相互独立, 即 $P(X|Y=c_k )=P(x_1│Y=c_k )×…×P(x_n│Y=c_k )$ }- 属性条件独立性假设.

因此, 就可以将贝叶斯分类器写为:
$y=f(X)=arg⁡max_{c_k}⁡\dfrac{P(Y=c_k )∏_{j=1}^nP(x_j│Y=c_k ) )}{∑_{k=1}^KP(Y=c_k ) ∏_{j=1}^nP(x_j│Y=c_k )}$
其中, $y$ 是分类之后的标签, $arg⁡max_{c_k}⁡\dfrac{P(Y=c_k )∏_{j=1}^nP(x_j│Y=c_k ) )}{∑_{k=1}^KP(Y=c_k ) ∏_{j=1}^nP(x_j│Y=c_k )}$ 表示从 $\dfrac{P(Y=c_k )∏_{j=1}^nP(x_j│Y=c_k ) )}{∑_{k=1}^KP(Y=c_k ) ∏_{j=1}^nP(x_j│Y=c_k )}$ 里面挑出使该式子最大的 $c_k$ 当作 $y$ . 对于不同类别 $Y=c_k$ 来说上式的分母都一样就不用比较了, 所以:
$y=f(X)=arg⁡max_{c_k}P(Y=c_k ) ∏_{j=1}^nP(x_j│Y=c_k )$

对于离散属性而言, $P(x_j |Y=c_k )$ 可以用频数估计出来
对于连续属性而言, 可以假定 $P(x_j |Y=c_k )~N(μ_{c,j},σ_{c,j}^2)$ , 其中 $μ_{c,i}$ 和 $σ_{c,i}^2$ 分别取 $c_k$ 样本第 $j$ 个属性上取值的均值和方差.