贝叶斯决策理论与贝叶斯分类器

一、贝叶斯决策理论

贝叶斯决策论是概率框架下实施决策的基本方法,对于分类任务来说,在所有相关概率都已知的理想情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。

  • 1.1最小风险贝叶斯决策

    假设有N种可能的类别标记, 即 γ={ c1,c2,...,cN} γ = { c 1 , c 2 , . . . , c N } . λij λ i j 是将一个真实类别为 cj c j 的样本误分类为为 ci c i 的损失。 基于后验概率 P(ci|x) P ( c i | x ) 可得将样本x分类为 ci c i 所产生的期望损失, 或者称为条件风险(Conditional Risk)

    R(ci|x)=j=1n λijP(cj|x) R ( c i | x ) = ∑ j = 1 n   λ i j P ( c j | x )

    我们的任务是寻找一个判定准则 h:χy h : χ ↦ y 以最小化总体风险:
    R(h)=Ex[R(h(x)|x)] R ( h ) = E x [ R ( h ( x ) | x ) ]

    显然,对每个样本x,若h能最小化条件风险 R(h(x)|x) R ( h ( x ) | x ) ,则总体风险 R(h) R ( h ) 也将被最小化,这即是最小化整体风险(也称贝叶斯判别准则),只需在每个样本上选择那个能使条件风险 R(c|x) R ( c | x ) 最小的类别标记,即:
    h(x)= argmincyR(c|x) h ∗ ( x ) =   a r g m i n c ∈ y ⁡ R ( c | x )

    其中, h h ∗ 称为贝叶斯最优分类器,与之对应的总体风险 R(h) R ( h ∗ ) 称为贝叶斯风险, 1R(h) 1 − R ( h ∗ ) 反映了分类器所能够达到的最好性能,即通过机器学习所能产生的模型精度的上限。

  • 1.2最小错误率贝叶斯决策
    若目标是最小化分类错误率,则误判损失 λij λ i j 可写成:
    λij={ 01,if i=jotherwise λ i j = { 0 i f   i = j 1 , o t h e r w i s e

    此时条件风险 R(cj|x)=Mi=1P(ci|x)(ij)=1P(cj|x) R ( c j | x ) = ∑ i = 1 M P ( c i | x ) ( 注 : i 不 等 于 j ) = 1 − P ( c j | x )
    于是,最小化分类错误率的贝叶斯最优错误率:
    h(x)= argmaxcyp(c|x) h ∗ ( x ) =   a r g m a x c ∈ y ⁡ p ( c | x )

    即,对每个样本 x x ,选择能使后验概率 P ( c | x ) 最大的类别标记。

二、朴素贝叶斯分类器

1. 朴素贝叶斯的理论基础
朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的分类方法。

这里提到的贝叶斯定理、特征条件独立假设就是朴素贝叶斯的两个重要的理论基础。

1.1 贝叶斯定理

先看什么是条件概率。
P(A|B)表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为: P(A

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值