为什么朴素贝叶斯如此“朴素”?

为什么朴素贝叶斯如此“朴素”?

​ 贝叶斯算法简单高效,在处理分类问题上,是首先要考虑的方法之一。
1、简述贝叶斯定理:

​ 贝叶斯分类是一类分类算法的总称,这类算法均已贝叶斯定理为基础,故统称为贝叶斯分类。

​ 公式如下:

​ P(B|A)=P(A|B)P(B)P(A)


该公式最大的优点就是可以忽略AB的联合概率直接求其条件概率分布。
2、朴素贝叶斯分类:

​ 因为它假定所有的特征在数据集中的作用是同样重要和独立的,正如我们所知,这个假设在现实世界中是很不真实的,因此,说是很“朴素的”。

​ 朴素贝叶斯分类是一种十分简单的分类算法,其思想是朴素的,即:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。

​ 朴素贝叶斯分类的正式定义如下:

1、设x=a1,a2,a3,.....,am

为一个待分类项,而每个a为x的一个特征属性。

​ 2、有类别集合C=y1,y2,y3,.....,yn

.

​ 3、计算:P(y1|x),P(y2|x),.....,P(yn|x),x∈yk.

​ 4、如果P(yk|x)=max{P(y1|x),P(y2|x),p(y3|x),....p(yn|x)},x∈yk.

​ 那么现在的关键就是如何计算第三步中各个条件概率。做法如下:

​ 1、找到一个已知分类的待分类项集合,这个集合叫做训练样本集。

​ 2、统计得到在各类别下各个特征属性的条件概率估计。即 P(a1|y1),P(a2|y1),....,P(am|y1);P(a1|y2),...,P(am|y2);P(a1|yn),P(a2|yn),.....P(am|yn).

​ 3、如果各个特征属性是条件独立的,则根据贝叶斯定理有如下推到:

​ P(YI|X)=P(x|yi)P(yi)P(x)

​ 因为分母对于所有类别为常数,我们只要将分子最大化即可。又因为各特征属性是条件独立的(朴素贝叶斯为什么“朴素”的原因),所以有:

P(x|yi)P(yi)=P(a1|yi)P(a2|yi).......P(am|yi)P(yi)=P(yi)∏j=1mP(aj|yi)

 

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值