m估计及其推到公式

最新推荐文章于 2024-02-25 21:34:19 发布

Adaline_juan

最新推荐文章于 2024-02-25 21:34:19 发布

阅读量9.4k

点赞数 3

文章标签： m估计推到公式

为什么要有m-估计？

当我们通过在全部事件的基础上观察某事件出现的比例来估计概率时，例如：P=nc/n.，其中nc为该类别中的样本数量，n为总样本数量。若n=5，当P=0.6时，则nc为3。多数情况下该比例是对概率的一个良好的估计。但当nc很小时估计会较差，例如：P=0.08，样本中同样有5个样例，那么对于nc最可能的取值只有0,。这会导致两个问题：

1、nc/n产生了一个有偏的过低估计概率。

2、当此概率估计为0时，将来的查询此概率项将会在贝叶斯分类器中占统治地位。原因是贝叶斯公式中计算得量其他所有概率项都将乘以此0值。

为了避免此问题，所以需要采用一种估计概率，即如下定义的m-估计：

其中nc为该类别中的样本数量，n为总样本数量，p为将要确定的概率的先验估计，m为等效样本大小的常量。

为什么m-估计的公式是这样的？

首先，请思考问题出现的根本原因，问题出现的根本原因是样本数量过小。所以为了避免此问题，最好的方法是等效的扩大样本的数量，即在为观察样本添加m个等效的样本，所以要在该类别中增加的等效的类别的数量就是等效样本数m乘以先验估计p。

为什么在贝叶斯应用（如mahout）中使用的公式如下呢？

其中nk为单词W出现的次数，n为所有单词出现的次数。

m 估计的推导公式：

设文本由一个属性向量x=(x1,x2,x3,...xn)表示，给定分类集合Y={yj|yj 属于Y}

求文本向量的一个属性xi 对于分类yj的类条件概率P(xi|yj)。

首先假设Nyj 是分类yj的样本总数，Nxi是包含属性xi且属于分类yj的样本数。

由概率知识得到：

P(xi|yj) = Nxi / Nyj ------公式1

如果采用M-Estimate，得到的公式是

P(xi|yj) = (Nxi + mp) / (Nyj + m) ------公式2

其中p是 P(xi|yj) 的近似值，即有 Nxi / Nyj ~= p

由公式1和p逐步推导出公式2的过程如下：

为简化起见，设 a = Nyj, b = Nxi，则 p ~= b / a, 可得：

P(xi | yj) = b / a

= b(a+m) / a(a+m)

= (ba + bm) / a(a+m)

= (b + m*(b/a)) / (a+m)

~= (b + mp) / (a+m) -------- 用 p ~= b / a 代入。

= (Nxi + mp) / (Nyj + m)

得证。

M估计的实际应用：

1. 多项式模型：

m = |V|，p = 1/|V|, 这里|V|为样本空间V的词库大小。

2. 伯努利模型：

m = 2， p = 1/2

关注

3
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Adaline_juan CSDN认证博客专家 CSDN认证企业博客

码龄8年

0: 原创

173万+: 周排名

33万+: 总排名

9484: 访问

: 等级

99: 积分

1: 粉丝

3: 获赞

0: 评论

17: 收藏

私信

关注

热门文章

m估计及其推到公式 9481

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。