sklearn朴素贝叶斯分类器_朴素贝叶斯分类器简介

如果您参加过概率论和统计学课程,您可能会熟悉着名的贝叶斯定理。

在数学上,贝叶斯定理看起来像:

7fdc3f9bc0d967f0b3b47b02b3f8d5a1.png

朴素贝叶斯公式

在给定事件A和B发生的情况下,P(A | B)是后验概率,P(B | A)是似然。

在技​​术术语中,朴素贝叶斯算法是一种概率模型,用作机器学习中的分类算法。

考虑一个数据集,其中X是特征向量,X = [“Name”, “Age”, “Dribbling”, “Defending”],Y是目标向量,Y =[ “Yes”, “No” ]。

8a30acb8dc11bc892054859db9dfc2ee.png

给定一定的测试数据,观察X= [" Sid ", 25,70 - 80,80 - 90]。Y '的预测值是多少?

从本质上讲,就贝叶斯公式而言,我们可以将其写成:

3c921e96757ba3bae6ffb0b4f8731c47.png
86df1c106001b4f42c9de5763a30638d.png

为了模拟P(X | Y'),我们将做出一个非常强大的假设。我们将假设X(I)的全部条件独立给Y' 。这导致的假设就是所谓的朴素贝叶斯假设,并将得到的算法称为朴素贝叶斯分类器。

对于模型P(X|Y '),我们将做一个假设。我们假设给定目标值(Y' )时属性(X(i))之间相互条件独立,这种假设称为朴素贝叶斯假设,算法称为朴素贝叶斯分类器。

我们得到,

P(X|Y’) = P(X = x1|Y’) * P(X = x2|Y’,x1) * P(X = x3|Y’,x1,x2)

在应用朴素贝叶斯的假设时,我们得到了,

7b1388c4fbfcc63accb9b211915e7797.png

现在让我们来看看计算:

P(Y’ = “Yes”) = 4/10, P(Y’ = “No”) = 6/10.

123e4d2c7bfe3bfcd163afa27c691042.png

同样的,

27e64c9ccd9af25ac01e2f4f1869a9be.png

因此我们得到:

232ea3e253c28531345c22668fc66e35.png

我们得到的最终结果是:

148529c4e858c10c4b0b4755ad56b9cd.png

由于分母P(X)是相同的,我们只能比较分子来找出哪个概率更大。

显然, P(Y’ = Yes | X ) > P(Y’ = No | X)

因此,对于特征= [“Sid”, 25, 70–80, 80–90], Y’ = “Yes”。

使用机器学习库sklearn时的Python实现如下:

610f22fb8eacc8d304f6b4bdd3befb4e.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值