分布式:可以将数据集分成较小的子集,然后计算每一个每一个子集的度量,最后合并计算结果,得到整个数据集的度量(sum、count)
代数式:通过一个代数函数或者分布式 多个分布式度量的计算(sum/count)
整体度量:对整个数据集度量,不能通过划分子集并合并子集来度量。(中位数)
分布式、代数式、整体度量
最新推荐文章于 2021-04-12 00:08:26 发布
分布式:可以将数据集分成较小的子集,然后计算每一个每一个子集的度量,最后合并计算结果,得到整个数据集的度量(sum、count)
代数式:通过一个代数函数或者分布式 多个分布式度量的计算(sum/count)
整体度量:对整个数据集度量,不能通过划分子集并合并子集来度量。(中位数)