朴素贝叶斯的参数估计

输入空间 XRn n 维向量的集合,输出空间 Y={c1,c2,...,cK} 为类标记集合设输入为特征向量 x ,输出为类标记 y X 为定义在输入空间上的随机向量, Y 是定义在输出空间上的随机向量。 P(x,y) X Y 的联合概率分布,训练数据集 T={ (x1,y1),(x2,y2),...,(xN,yN)} P(X,Y) 独立同分布产生。

朴素贝叶斯的决策函数为:

y=argmaxckP(Y=ck)jNP(X(j)=x(j)|Y=ck)

模型的学习意味着估计 P(Y=ck) P(X(j)=x(j)|Y=ck) . 可以使用极大似然估计(MLE)最大后验概率估计(MAP)来进行参数估计.这里主要讨论极大似然估计。

1. 极大似然估计

极大似然估计适于“模型已知,参数未定”的情况. 已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。最大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。我们所估计的模型参数,要使得产生这个给定样本的可能性最大. 该方法通常有以下几个步骤:

  • 写出似然函数
  • 对似然函数取对数
  • 求导数
  • 解似然方程

其中最关键的一步在于列出似然函数。

2. 从变量 Y 的分布律出发构造似然函数

2.1 最简单的假设:变量 Y 服从伯努利分布

为简单起见,考虑二分类的情况,并假设变量 Y 服从伯努利分布。设 p{Y=c1}=p ,则 p{ Yc1}={ Y=c2}=1p . 统一起来表示为 P{ Y=t}=pt(1p)1t(t=0,1) .

事件 yi 发生的概率是 P{ yi=t}=pti(1p)1ti . 设训练集中 c1 出现的次数为 d ,则 d=Ni=1I(yi=c1) .

样本联合分布为:

L(y1,y2,...,yN;p)=i=1Npti(1p)Nti=pd(1p)Nd

L(y1,y2,...,yN;p) 看成是 p 的函数,称为参数 p 的似然函数,记为 L(p) . 取对数似然函数 lnL(p)=dlnp+(Nd)ln(1p) ,对其求导有:

lnL(p)p=dpNd1p

lnL(p)p =0,可解得 p=dN ,即:

P(Y=ck)=
  • 8
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值