朴素贝叶斯（分类）推导

最新推荐文章于 2024-04-30 17:15:32 发布

lhz泽少

最新推荐文章于 2024-04-30 17:15:32 发布

阅读量333

点赞数

本文链接：https://blog.csdn.net/li15006474642/article/details/104652158

版权

本文详细介绍了朴素贝叶斯模型的推导过程，从生成模型出发，利用条件独立假设，通过最大似然优化参数，最终得出概率参数π和θ的计算公式，即πk=∑u=1ununk和θij=∑v=1v∑i;y=kniv∑i;y=knij，揭示了朴素贝叶斯分类器中类别占比和词频比率的计算原理。

摘要由CSDN通过智能技术生成

传统的分类器朴素贝叶斯很多人都知道怎么用，但是有没有想过它的原理，它是怎么样被一步一步的推导出来的。今天咱们就推导一下朴素贝叶斯模型。
现在有数据集 $D=\{(x^1,y^1),(x^2,y^2),...,(x^n,y^n)\}$
$x$ 表示的是一个文档的所有单词
$y$ 表示的是一个文档属于的类别。
$n$ 表示的是文档的数量

首先我们知道朴素贝叶斯是一个生成模型因此我们的目标函数可以写成：
$\prod_{i=1}^np(x^i,y^i)= \prod_{i=1}^np(x^i|y^i)\cdot p(y^i)= \prod_{i=1}^np(x^i_1,x^i_2,x^i_3,...,x^i_m|y^i)\cdot p(y^i)$