朴素贝叶斯分类实验(垃圾邮件分类以及垃圾短信过滤数据集)

贝叶斯公式

先验概率

P ( c j ) P(c_j) P(cj)代表未有训练模型之前,根据历史数据/经验估算 c j c_j cj拥有的初始概率。 P ( c j ) P(c_j) P(cj)常称为 c j c_j cj的先验概率(prior probability),它反映了 c j c_j cj的概率分布,该分布独立于样本。
公式如下所示:
P ( c j ) = ∣ c j ∣ ∣ D ∣ P(c_j)=\frac{|c_j|}{|D|} P(cj)=Dcj
∣ c j ∣ |c_j| cj表示样例中属于 c j c_j cj的样例数,|D|表示总样例数。

后验概率

在给定数据样本x时 c j c_j cj成立的概率 P ( c j ∣ x ) P(c_j|x) P(cjx)称为后验概率(posterior probability),因为它反映了看到数据样本x后 c j c_j cj成立的置信度。后验概率是观测到x后对结果y的估计,大部分机器学习模型尝试得到后验概率。

贝叶斯定理

已知两个独立事件A和B,事件B发生的前提下,事件A发生的概率可以表示为 P ( A ∣ B ) P(A|B) P(AB),求解 P ( A ∣ B ) P(A|B) P(AB)的公式如下所示:

P ( A ∣ B ) = P ( A , B ) P ( B ) P(A|B)=\frac{P(A,B)}{P(B)} P(AB)=P(B)P(A,B)

=> P ( A , B ) = P ( B ) ∗ P ( A ∣ B ) = P ( A ) ∗ P ( B ∣ A ) P(A,B)=P(B)*P(A|B)=P(A)*P(B|A) P(A,B)=P(B)P(AB)=P(A)P(BA)

=> P ( A ∣ B ) = P ( A

  • 1
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值