针对周期类型统计特征计算方差,为了避免记录每笔交易的统计属性值,造成Redis内存的大量占用和计算性能问题,采用增量的方式计算方差。
在方差计算过程中存在如下几种情况:
1) 已知一个样本的方差,当新增一个元素时,需重新计算样本的方差;
2) 已知两个样本的方差,将两样本合并,计算新的样本的方差;
3) 已知一个样本的方差,当需要从样本中删除一个元素时,需重新计算样本的方差
上述1)是2)的特例,所以针对增量计算需要考虑2)和3)两种情况。
(一)方差的定义
假设X样本有N个样本值:
X样本的平均值计算:
X样本的方差计算公式: