贝叶斯分类器基本理解

基于贝叶斯分类器的分类问题主要是要求得:对于任一样本X,选择能够使得后验概率p(c/X)最大的类标记。一般,后验概率难以直接获得,可以通过条件概率的公式对后验概率进行一个转换:p(c/X)=\frac{p(c)p(X/c)}{p(X)},对于给定样本p(X)与类标记无关,因此只需要基于训练数据集估计p(c),p(X/c)。其中,p(c)是先验概率,p(X/c)是类条件概率。由于类条件概率涉及到多个属性的联合分布,难以从有限的训练样本中得到,故在朴素贝叶斯分类器中假设“各属性条件独立”,则p(X/c)=p(x1/c)p(x2/c)...p(xd/c)。到这里,可以得出,由最初的求max p(c/X)  转变为求max p(c)\prod_{i=1}^{d}p(xi/c), 故现在只需根据已有的数据集求出各类别p(Ck)的概率,以及相应类别Ck下的各属性的类条件概率函数p(xi/Ck), 在求类条件概率时,假设它们服从某一参数分布,例如常用的高斯分布,从而求出相应的参数,求出先验概率和类条件概率之后,对于任意给定的测试样本X, 都可以将其属性值带入p(c)\prod_{i=1}^{d}p(xi/c)

,比较在哪个类别下的概率最大,该样本X就属于哪一类。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值