注: 在本文中, 我将暂时将sketch翻译成为梗概
我们首先定义两个参数和
, 则梗概的准确性保证可定义为, 我们向这个梗概发起一个查询, 查询结果小于因子
的概率大于
.
Frequency Moment:
数据流型(stream)的定义如下: 假设有一个向量, 且
, 当一个更新项
于时间
到达的时候, 则有:
如果是必须为正, 则该数据流是现金注册型 (cash register case); 否则, 如果
可以为负值, 则该数据流为栅门型 (turnstile case). 在栅门型中, 如果
的值可以为负, 则我们将它称为一般栅门型 (general case), 如果应用层保证
的值不可为负, 则我们将它称为非负栅门型 (non-negative case). 数据流型的定义又可以表述为, 我们可能有无数个更新项
, 但是
的值只能为
. 所以, 这些更新项可以归类为
组. 我们令
, 即
是所有对应于
的更新项中
的和.
基于向量和
, 可以有以下三种类型的查询:
- 点查询 (point query) : 返回
的值
- 范围查询(range query) : 返回
- 内积查询(inner product