贝叶斯公式在机器学习中有什么用,实例讲解Python实现朴素贝叶斯分类器

本文介绍了贝叶斯公式及其在机器学习中的应用,特别是在朴素贝叶斯分类器中的作用。通过实例解释了如何计算样本属于特定类别的概率,并探讨了Python中实现朴素贝叶斯分类器的过程。同时,文章指出贝叶斯分类器假设特征之间相互独立,这一前提在实际问题中可能不成立,但在数据量足够大时趋于合理。
摘要由CSDN通过智能技术生成

贝叶斯公式=贝叶斯定理

贝叶斯公式到底想说啥

贝叶斯公式就是想用概率数学来表示事件发生依赖关系。
贝叶斯公式长下面这样:
在这里插入图片描述

用图形怎么表示贝叶斯公式

P ( X = x ) P(X=x) P(X=x)就是X的面积。
P ( Y = y ) P(Y=y) P(Y=y)就是Y的面积。
P ( X = x ∣ Y = y ) P(X=x|Y=y) P(X=xY=y)是什么? P ( X = x ∣ Y = y ) P(X=x|Y=y) P(X=xY=y)是指Y发生的情况下X发生的概率。用图形表示就是,只看Y的情况下Y里面的X占比多少。这不就是相交部分除以Y的面积么?相交部分计算方式=X的面积*相交部分占X的比率。
再看看前面的公式就完全能理解了。
在这里插入图片描述

朴素贝叶斯分类器

任何机器学习都是要套一个数学模型。那朴素贝叶斯分类器套的是什么模型呢?
它是想计算一个概率值。什么概率呢?就是当样本为x时,这个样本来自类A的概率是多少,来自类B的概率是多少。如果来自类A的概率>来自类B的概率。那就分类器输出样本属于类A
用公式表示就是P(A|x)>P(B|x)=》x属于A .其中P(A|x)表示当样本取值是x时它来自类A的概率,P(B|x)表示当样本取值是x时它来自类B的概率。
这样咋看好像很有道理的样子。那么问题来了,我咋知道样本x属于A和B的概率,要我知道了那还用分嘛?

接下来看,如何计算样本取值为x时属于A的概率P(A|x)、和属于B的概率P(B|x)(下面一段话很重要一定要仔细看,没弄懂不要往后看)

根据贝叶斯公式我们知道 P ( A ∣ x ) = P ( x ∣ A ) ∗ P ( A ) P ( x ) P(A|x)=\frac {P(x|A)*P(A)} {P(x)} P(Ax)=P(x)P(xA)P(A)。其中P(A)表类A占比总数据中的比例。P(x)是指样本值等于x的数据占总数据的比例。P(x|A)表示在类A中,有多少个和x一样的数据。这三个概率我们都是知道的。那么或许你会问前面只有一个特征,那两个特征的样本怎么计算概率?答:假设一个样本有两个特征x,y。那么 P ( x , y ) = P ( x ) ∗ P ( y ) , P ( x , y ∣ A ) = P ( x ∣ A ) ∗ P ( y ∣ A ) , P ( A ) 和 只 有 一 个 特 征 时 计 算 方 法 一 样 P(x,y)=P(x)*P(y),P(x,y|A)=P(x|A)*P(y|A), P(A)和只有一个特征时计算方法一样 P(x,y)=P(x)P(y)P(x,yA)=

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值