朴素贝叶斯算法原理理解

朴素贝叶斯流程如下:

1.设 x={a1,a2,…,am}为一个待分类项,而每个 a 为 x 的一个特征属性。
2.有类别集合 C={y1,y2,…,yn}。
3.计算 P( y1|x) ,P( y2|x),…, P( yn|x)。
4.如果 P( yk|x) =max{P( y1|x),P( y2|x),…, P( yn|x)},则 x∈yk。
那么现在的关键就是如何计算第 3 步中的各个条件概率。我们可以这么做:
  (1) 找到一个已知分类的待分类项集合,也就是训练集。
  (2) 统计得到在各类别下各个特征属性的条件概率估计。即:

          P(a1|y1) , P(a2|y1),…, P(am|y1);
        P(a1|y2) , P(a2|y2),…, P(am|y2);
        P(am|yn) , P(am|yn),…, P(am|yn)。
  (3) 如果各个特征属性是条件独立的(或者我们假设它们之间是相互独立的),则根 据贝叶斯定理有如下推导:

    因为分母对于所有类别为常数,只要将分子最大化皆可。又因为各特征属性是条 件独立的,所以有:

综上,朴素贝叶斯分类的流程可以表示如下:

       第一阶段:训练数据生成训练样本集

  第二阶段:计算每个类别 P(yi)

  第三阶段:计算各类别下各个特征属性的条件概率估计 

       第四阶段:对每个类别计算 Py) P( y)

  第五阶段:以 Py) P( y) 的最大项作为 x 的所属类别

 

参考原文地址:https://www.cnblogs.com/taich-flute/p/6813815.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值