新的数据结构?
- 基于 hyperloglog 算法,在极小空间完成独立数量统计;
- 本质还是字符串;
三个命令
-
pfadd key element [element...]
向 hyperloglog 添加元素; -
pfcount key [key]
计算 hyperloglog 的独立总数; -
pfmerge destkey sourcekey [sourcekey...]
合并多个 hyperloglog;
内存消耗
- 存 1000000 个 id 只需要 15KB;
使用经验
- 是否能容忍错误?使用 hyperloglog 的错误率是 0.81%;
- 是否取出单条数据?hyperloglog 是无法取出单条数据的;