注: 在本文中, 我将暂时将sketch翻译成为梗概
我们首先定义两个参数和, 则梗概的准确性保证可定义为, 我们向这个梗概发起一个查询, 查询结果小于因子的概率大于.
Frequency Moment:
数据流型(stream)的定义如下: 假设有一个向量, 且, 当一个更新项于时间到达的时候, 则有:
如果是必须为正, 则该数据流是现金注册型 (cash register case); 否则, 如果可以为负值, 则该数据流为栅门型 (turnstile case). 在栅门型中, 如果的值可以为负, 则我们将它称为一般栅门型 (general case), 如果应用层保证的值不可为负, 则我们将它称为非负栅门型 (non-negative case). 数据流型的定义又可以表述为, 我们可能有无数个更新项, 但是的值只能为. 所以, 这些更新项可以归类为组. 我们令, 即是所有对应于的更新项中的和.
基于向量和, 可以有以下三种类型的查询:
- 点查询 (point query) : 返回的值
- 范围查询(range query) : 返回
- 内积查询(inner product query) : 返回
我们定义如下:
. 特别地,