朴素贝叶斯笔记

朴素贝叶斯

  • 朴素贝叶斯假设所有变量都是独立的

[!IMPORTANT]

贝叶斯公式:
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B)=\frac{P(B|A)P(A)}{P(B)} P(AB)=P(B)P(BA)P(A)

拓展后
p ( C ∣ F 1 , … , F n ) = p ( C ) p ( F 1 , … , F n ∣ C ) p ( F 1 , … , F n ) p(C|F_1,\ldots,F_n)=\frac{p(C) p(F_1,\ldots,F_n|C)}{p(F_1,\ldots,F_n)} p(CF1,,Fn)=p(F1,,Fn)p(C)p(F1,,FnC)

  • C C C为独立类别变量,有若干类别
  • $F_1 \cdots F_n 为条件变量, 为条件变量, 为条件变量,C 条件依赖于 条件依赖于 条件依赖于F$

因为变量独立, p ( F 1 , … , F n ∣ C ) = ∏ i = 1 n p ( F i ∣ C ) p(F_1,\ldots,F_n|C)= \prod_{i=1}^np(F_i|C) p(F1,,FnC)=i=1np(FiC)
KaTeX parse error: Expected 'EOF', got '&' at position 21: …F_1,\ldots,F_n)&̲=&\frac{p(C)\pr…
得到 C C C不同类别对于给定条件时的概率,有分类器
classify ⁡ ( f 1 , … , f n ) = argmax ⁡ c p ( C = c ) ∏ i = 1 n p ( F i = f i ∣ C = c ) \operatorname{classify}(f_1,\ldots,f_n)=\underset{c}{\operatorname{argmax}}p(C=c)\prod_{i=1}^np(F_i=f_i|C=c) classify(f1,,fn)=cargmaxp(C=c)i=1np(Fi=fiC=c)

  • 贝叶斯拓展:高斯朴素贝叶斯,当样本较少,不适合细分类别,可以使用均值方差来代替原始数据

案例(文本分类)

  • 需要将文本分为两类,喜欢(like)和不喜欢(dislike)

  • 先拆分文本,计算每个单词出现时对应类别的概率
    P ( w i ∣ h j ) = ( n j i + 1 ) / ( n j + ∣ V o c u b u l a r y ∣ ) P{\left(w_i|h_j\right)}=\left(n_j^i+1\right)/{\left(n_j+\left|Vocubulary\right|\right)} P(wihj)=(nji+1)/(nj+Vocubulary)

    • w i w_i wi为类别(like&dislike)
    • h j h_j hj为单词
    • n j i n^i_j nji为单词 j j j对应的类别 i i i出现的次数
    • n j n_j nj为单词 j j j出现的总次数
    • V o c u b u l a r y Vocubulary Vocubulary为总词数
  • 取最大概率
    h N B = arg ⁡ max ⁡ h j ∈ { l i k e , d i s l i k e } P ( h j ) ∏ i = 1 n P ( w i ∣ h j ) h_{NB}=\arg\max_{h_j\in\{like,dislike\}}P(h_j)\prod_{i=1}^{n}P(w_i|h_j) hNB=arghj{like,dislike}maxP(hj)i=1nP(wihj)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

冰宸旻

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值