常用集合统计模式
- 聚合统计
- 排序统计
- 二值状态统计
- 基数统计
聚合统计
- 指统计多个集合元素的聚合结果
- 统计多个集合的共有元素(交集统计)
- 把两个集合相比,统计其中一个集合独有的元素(差集统计)
- 统计多个集合的所有元素(并集统计)
排序统计
- list或者sorted_set类型
- 有序统计
二值状态统计
- 指集合元素的取值就只有 0 和 1 两种
- bitmap,用 String 类型作为底层数据结构实现的一种统计二值状态的数据类型
基数统计
- 统计就是指统计一个集合中不重复的元素个数
- set集合类型 数据量过大占用空间过高
- HyperLogLog 计算基数所需空间是固定的,每个 HyperLogLog 只需要花费 12 KB 内存,就可以计算接近 2^64 个元素的基数
- HyperLogLog 的统计规则是基于概率完成的,所以它给出的统计结果是有一定误差的,标准误算率是 0.81%