朴素贝叶斯笔记

最新推荐文章于 2024-10-06 21:18:37 发布

冰宸旻

最新推荐文章于 2024-10-06 21:18:37 发布

阅读量800

点赞数 18

分类专栏：机器学习文章标签：笔记机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_64404339/article/details/142529799

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

朴素贝叶斯

朴素贝叶斯假设所有变量都是独立的

[!IMPORTANT]

贝叶斯公式：
$P(A|B)=\frac{P(B|A)P(A)}{P(B)}$

拓展后
$p(C|F_1,\ldots,F_n)=\frac{p(C) p(F_1,\ldots,F_n|C)}{p(F_1,\ldots,F_n)}$

$C$ 为独立类别变量，有若干类别
$F_1 \cdots F_n $为条件变量，$ C $条件依赖于$ F$

因为变量独立， $p(F_1,\ldots,F_n|C)= \prod_{i=1}^np(F_i|C)$
$KaTeX parse error: Expected 'EOF', got '&' at position 21: …F_1,\ldots,F_n)&̲=&\frac{p(C)\pr…$
得到 $C$ 不同类别对于给定条件时的概率，有分类器
$\operatorname{classify}(f_1,\ldots,f_n)=\underset{c}{\operatorname{argmax}}p(C=c)\prod_{i=1}^np(F_i=f_i|C=c)$

贝叶斯拓展：高斯朴素贝叶斯，当样本较少，不适合细分类别，可以使用均值方差来代替原始数据

案例（文本分类）

需要将文本分为两类，喜欢(like)和不喜欢(dislike)
先拆分文本，计算每个单词出现时对应类别的概率
$P{\left(w_i|h_j\right)}=\left(n_j^i+1\right)/{\left(n_j+\left|Vocubulary\right|\right)}$
- $w_i$ 为类别(like&dislike)
- $h_j$ 为单词
- $n^i_j$ 为单词 $j$ 对应的类别 $i$ 出现的次数
- $n_j$ 为单词 $j$ 出现的总次数
- $V oc u b u l a ry$ 为总词数
取最大概率
$h_{NB}=\arg\max_{h_j\in\{like,dislike\}}P(h_j)\prod_{i=1}^{n}P(w_i|h_j)$

关注

18
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

冰宸旻 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。