【机器学习】朴素贝叶斯分类

一、分类的数学定义:

从数学角度来说,分类问题可做如下定义:

           已知集合:,确定映射规则,使得任意有且仅有一个使得成立。(不考虑模糊数学里的模糊集情况)。

           其中C叫做类别集合,其中每一个元素是一个类别,而I叫做项集合,其中每一个元素是一个待分类项,f叫做分类器。分类算法的任务就是构造分类器f。

 

二、贝叶斯统计基础:

           定理解决了现实生活里经常遇到的问题:已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B|A)。这里先解释什么是条件概率:

     表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为。我们可以很容易直接得出P(A|B),P(B|A)则很难直接得出,但我们更关心P(B|A),贝叶斯定理就为我们打通从P(A|B)获得P(B|A)的道路:

  

 

三、朴素贝叶斯分类的数学原理

           朴素贝叶斯分类的正式定义如下:

  1、设为一个待分类项,每个a为x的一个特征属性。这些特征属性需要人工给定。

  2、预先得到类别集合

  3、人工计算

4、如果,则

现在的关键就是如何定义和计算第3步中的各个条件概率。我们可以这么做:

1、找到一个已知分类的待分类项集合,这个集合叫做训练样本集。训练样本需要人工标记。

2、统计得到在各类别下各个特征属性的条件概率估计。即这些是统计出类别为yi时,其特征值ai有多大的贡献比率。

3、如果各个特征属性是条件独立的,则根据贝叶斯定理有如下推导:  分母对于当前类别x为常数,所以不用管分母,因为我们只要将分子最大化皆可。又因为各特征属性是条件独立的,所以有:   

 

上述值取哪个yi最大,当前x就属于哪个yi

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值