分组与去重
数据分组对应SQL数据中常见的group by的操作,从某个维度上对拥有相同的 点进行分组,比如根据年龄分组,根据出生省份分组等。
数据去重则是为了去除结果集中的相关的元素,去除在某个维度上相同的数据。
指令
- group()
对结果集进行分组,可通过by(property)来指定根据什么维度进行分组,可称维度为分组键;如果不指定维度则以元素id作为分组键,相当于重复的元素被分为一组。每一组由分组键+组内元素列表构成。如果有需要也可对每一组的元素列表进行reduce操作,依然使用by()语句,如by(count())对组内元素计数。 - groupCount()
对结果集进行分组,并统计每一组的元素个数。每一组由分组键+组内元素数量构成。 - dedup()
去除结果集中相同的元素,可通过by(property)来指定根据什么维度进行去重。 - by()
语义上一般指“根据什么维度”,与上述语句配合使用,如group().by()、dedup().by()等。也可与其它语句配合,如前面讲到的排序order().by()及路径path().by()等。
参考:https://blog.csdn.net/javeme/article/details/82769457