机器学习(三):朴素贝叶斯(NB)

本文介绍了朴素贝叶斯分类器的基本思想、数学预备知识,包括条件概率、贝叶斯公式等,并详细阐述了朴素贝叶斯分类器的公式推导和分类过程。文章还提及了参数估计和Python代码实现的初步概念,但部分内容未展开,例如朴素贝叶斯的参数估计和完整的代码实现。
摘要由CSDN通过智能技术生成

更多内容关注公众号:数学的旋律
在这里插入图片描述


tb店铺搜:FUN STORE玩物社,专业买手挑选送礼好物

引言

    朴素贝叶斯(naïve Bayes)法是基于贝叶斯定理与特征条件独立假设的分类方法。在统计学中,相互独立的含义是它们中一个已发生,不影响另一个发生的概率,即特征条件独立指一个特征出现的可能性与它的相邻没有关系。
    基本思想如下:
    假设训练集标记类别集合为{c1,c2},P(c1|x1,x2)为给定数据点(x1,x2)来自类别c1的概率;P(c2|x1,x2)为给定数据点(x1,x2)来自类别c2的概率。若P(c1|x1,x2) > P(c2|x1,x2),数据点属于c1;若P(c1|x1,x2) < P(c2|x1,x2),数据点属于c2
    具体地可利用贝叶斯定理计算概率值。运算中,利用了特征条件独立的假设,由于这是一个较强的假设,使整个形式化过程变得原始简单,“朴素”由此得名。

一、数学预备知识

1.条件概率

设A,B是两个事件,且P(A)>0,称
P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A)={P(AB)\over{P(A)}} P(BA)=P(A)P(AB)为在事件A发生的条件下事件B发生的条件概率。

2.乘法公式

P(A)>0,则有
P ( A B ) = P ( B ∣ A ) P ( A ) P(AB)=P(B|A)P(A) P(AB)=P(BA)P(A)上式称为乘法公式。

3.全概率公式

设试验E的样本空间为S,A为E的事件,B1,B2,…,Bn为S的一个划分(即BiBj=∅,i≠j,i,j=1,2,…,n,且P{B1∪B2∪…∪Bn}=1),且P(Bi)>0(i=1,2,…,n),则
P ( A ) = P ( A ∣ B 1 ) P ( B 1 ) + P ( A ∣ B 2 ) P ( B 2 ) + … + P ( A ∣ B n ) P ( B n ) P(A)=P(A|B_1)P(B_1)+P(A|B_2)P(B_2)+…+P(A|B_n)P(B_n) P(A)=P(AB1)P(B1)+P(AB2)P(B2)++P(ABn)P(Bn)上式称为全概率公式。

4.贝叶斯公式

设试验E的样本空间为S,A为E的事件,B1,B2,…,Bn为S的一个划分(即BiBj=∅,i≠j,i,j=1,2,…,n,且P{B1∪B2∪…∪Bn}=1),且P(A)>0,P(Bi)>0(i=1,2,…,n),则
P ( B i ∣ A ) = P ( B i A ) P ( A ) = P ( A ∣ B i ) P ( B i ) ∑ j = 1 n P ( A ∣ B j ) P ( B j ) P(B_i|A)={ {P(B_iA)}\over{P(A)}}={ {P(A|B_i)P(B_i)}\over{\sum_{j=1}^nP(A|B_j)P(B_j)}} P(BiA)=P(A)P(BiA)=j=1nP(ABj)P(Bj)P(ABi)P(Bi)上式称为贝叶斯公式。

5.独立的定义

设A,B是两事件,如果满足等式
P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B)则称事件A,B相互独立,简称A,B独立。



二、朴素贝叶斯分类器

设输入空间X是n维实数向量空间 R n R^n Rn,输出空间为标记类别集合 Y = { c 1 , c 2 , ⋯   , c k } Y=\{c_1,c_2,\cdots,c_k\} Y={ c1,c2,,ck}。训练集为:
D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , ⋯   , ( x N , y N ) } D=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\} D={(x1,y1),(x2,y2),,(xN,yN)}其中 x i = ( x i ( 1 ) , x i ( 2 ) , ⋯   , x i ( i ) , ⋯   , x i ( n ) ) T x_i=(x_i^{(1)},x_i^{(2)},\cdots,x_i^{(i)},\cdots,x_i^{(n)})^T xi=(xi(1),xi(2),,xi(i),,xi(n))T x i ( j ) x_i^{(j)} xi(j)是第i个实例的第j个特征。
设测试实例为 x = ( x ( 1 ) , x ( 2 ) , ⋯   , x ( n ) ) T x=(x^{(1)},x^{(2)},\cdots,x^{(n)})^T x=(x(1),x(2),,x(n))T,其中 x ( i ) x^{(i)} x

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值