在实际环境中,经常会用到对数据进行去重计数
1、采用mongodb的distinct
db.collection.distinct("key").length
db 是数据库名称,collection是集合名称,key是去重的字段,根据自己的名称进行修改
该图显示了对uid去重后的数据总数
这种方法对大规模数据不适用,因为distinct最多只能使用16M空间,会出现下面的错误
2、采用MongoDB 的aggregate进行分组计数
官方文档地址 https://docs.mongodb.com/manual/aggregation/
下面是官网截图,aggregate的使用一目了然
aggregate基本功能是match,gr