在前面我们谈到了独立元素计数的问题。在本文中,我们将独立元素计数问题推广到更一般的问题,也就是矩估计问题。我们将先介绍矩的定义,然后介绍一个无偏的估计方法,最后介绍如何改进结果。这里还是讨论内存容量不够的情况。
一、矩估计
如果一个数据流,其中m为数据流的大小,
。我们可以定义每个元素
出现的次数为,其中
为第i个元素出现的次数。则流的k阶矩(k-th moment)
如果一个数据流,其中m为数据流的大小,
。我们可以定义每个元素
出现的次数为,其中
为第i个元素出现的次数。则流的k阶矩(k-th moment)