PRML Charpter 2 Probability Distribution 2.3.5 Sequential estimation讲义摘要

本文介绍了序列化估计方法,特别是Robbins-Monoro算法,用于在线更新高斯分布的参数。该算法通过每次新数据到来时修正估计值,逐步逼近最佳估计。在机器学习和大数据场景中,这种方法优于批处理。详细阐述了算法的三个关键步骤,并展示了如何应用该算法估计高斯分布的均值,其中修正系数an与数据方差和样本数量有关。
摘要由CSDN通过智能技术生成

2.3.4和2.3.5节分别介绍了求解高斯分布的最大似然估计的两种方法, 2.3.4节是先给出似然函数,然后求似然函数最大值。2.3.5节介绍了一种序列化估计方法。

序列化估计的思想是根据已有数据得出一个估计,等有新的数据之后,再用新数据对上一步估计结果进行修正,得到新的估计值。 这种方法在一些在线应用,或数据比较大的情况下,用批处理的方法不能处理完所有数据情况下,经常使用。

这里介绍了一种通用方法,Robbins-Monoro算法。 该算法主要步骤:

1)给出回归函数 f(u)=E[z|u]. 其中限定f(u)为非降函数;

2)根据迭代公式(2.129), 每次读入一个新数据,把这个新数据代入以后古籍中,得到一个修正量,不断迭代,逐步逼近函数f(u)=0的u值;

3)其中迭代公式中aN称为修正系数,需满足(2.130)(2.131)和(2.132)三个条件;

    Robbins-Monoro算法思想就是利用当前函数的取值去推断函数的零点的位置。令f(U*)=0, u表示当前估计值,由函数是非降的, 当f(u)>0时, 则u>U*, 此时应向左修正, 当f(u)<0时, 则 u<U*, 此时应向右修正。为了不让一次左修正和一次右修正又回到原点,每次修正步长(修正系数aN)应该有所减少&#x

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值