模式识别学习笔记——第2章 统计学习方法—2.1引言

从最基本的贝叶斯公式开始:

p(w_i|\vec{x})=\frac{p(\vec{x},w_i)}{p(\vec{x})}=\frac{p(\vec{x}|w_i)p(w_i)}{p(\vec{x})}

假定样本\vec{x}\in \mathbf{R}^d是由d维实数特征组成的,即\vec{x}=[x_1,x_2,...,x_d]^T;要研究的类别有c个,记作w_i,i=1,2,...,c

那么p(\vec{x}|w_i)表示各类中样本的分布密度,即类条件密度。表示为在w_i这个类别的条件下,出现特征\vec{x}的概率。同理可以知道后验概率p(w_i|\vec{x})表示在特征\vec{x}出现的情况下,是类别w_i的概率(i=1,2,...,c)。

我们所做的决策就是对于某个未知样本\vec{x},判断它属于哪一类w_i

做出的决策不一定都是正确的,对于只有两钟类型的问题(w_1w_2),在样本\vec{x}上错误的概率为

p(e|\vec{x})=\left\{ \begin{aligned} p(w_2|\vec{x}) \vec{x}\in w_1\\ p(w_1|\vec{x}) \vec{x}\in w_2 \end{aligned} \right.\label{eq1}

错误率定义为所有服从同样分布的独立样本上错误概率的期望,即

p(e)=\int p(e|\vec{x})p(\vec{x})d\vec{x}

这个式子我第一次看有点不理解,这里在多解释一下。举个例子,在只有两种类型的问题(w_1w_2)中,p(e|\vec{x})可以看作是关于特征\vec{x}的函数,为了求得整体的错误率,需要对p(e|\vec{x}) 在\vec{x}上依据取\vec{x}的概率求积分。(当然,如果有好好学习概率论,这里应该不难理解了)

有错误率,反之便是正确率,通常记作p(c),显然有p(c)=1-p(e)

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值