浅析mongodb的group分组统计

group做的聚合有些复杂。先选定分组所依据的键,此后MongoDB就会将集合依据选定键值的不同分成若干组。然后可以通过聚合每一组内的文档,产生一个结果文档。
和数据库一样group常常用于统计。MongoDB的group还有很多限制,如:返回结果集不能超过16M, group操作不会处理超过10000个唯一键,好像还不能利用索引[不很确定]。

Group大约需要一下几个参数。

 1.key:用来分组文档的字段。和keyf两者必须有一个
 2.keyf:可以接受一个javascript函数。用来动态的确定分组文档的字段。和key两者必须有一个
 3.initial:reduce中使用变量的初始化
 4.reduce:执行的reduce函数。函数需要返回值。
 5.cond:执行过滤的条件。
 6.finallize:在reduce执行完成,结果集返回之前对结果集最终执行的函数。可选的。
下面介绍一个实例:
先插入测试数据:

?
1
2
3
4
for (var i=1; i<20; i++){
var num=i%6;
db. test .insert({_id:i,name: "user_" +i,age:num});
}

1.普通分组查询

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
db. test .group({
             key:{age: true },
             initial:{num:0},
             $reduce: function (doc,prev){
                prev.num++
             }
            });
 
db.runCommand({group:
{
ns: "test" ,
key:{age: true },
initial:{num:0},
$reduce: function (doc,prev)
{
prev.num++
}
}
});

2.筛选后再分组

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
db. test .group({
key:{age: true },
initial:{num:0},
$reduce: function (doc,prev)
{
prev.num++
},
condition:{age:{$gt:2}}
});
 
db.runCommand({group:
{
ns: "test" ,
key:{age: true },
initial:{num:0},
$reduce: function (doc,prev)
{
prev.num++},
condition:{age:{$gt:2}}
}
});

3、普通的$where查询:

?
1
2
3
4
db. test . find ({$where: function (){
return this.age>2;
}
});

group联合$where查询

?
1
2
3
4
5
6
7
8
9
10
11
db. test .group({
key:{age: true },
initial:{num:0},
$reduce: function (doc,prev){
prev.num++
},
condition:{$where: function (){
return this.age>2;
}
}
});

4、使用函数返回值分组

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
// 注意,$keyf指定的函数一定要返回一个对象
db. test .group({
$keyf: function (doc){ return {age:doc.age};},
initial:{num:0},
$reduce: function (doc,prev){
prev.num++
}
});
 
db.runCommand({group:
{
ns: "test" ,
$keyf: function (doc){ return {age:doc.age};},
initial:{num:0},
$reduce: function (doc,prev){
prev.num++}
}
});

5.使用终结器

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
db. test .group({
$keyf: function (doc){ return {age:doc.age};},
initial:{num:0},
$reduce: function (doc,prev){
prev.num++
},
finalize: function (doc){ doc.count=doc.num;delete doc.num; }
});
 
db.runCommand({group:
{
ns: "test" ,
$keyf: function (doc){ return {age:doc.age};},
initial:{num:0},
$reduce: function (doc,prev){
prev.num++},
finalize: function (doc){ doc.count=doc.num;delete doc.num; }
}
});

有关MapReduce

?
1
2
3
4
5
6
7
8
9
10
11
12
13
// 首先插入测试数据
for (var i=1;i<21;i++)
{
db. test .insert({_id:i,name: 'mm' +i});
}
// 进行mapreduce
db.runCommand(
{
mapreduce: 'test' ,
map: function (){emit(this.name.substr(0,3),this);},
reduce: function (key,vals){ return vals[0];}, // 注意:vals是一个Object对象而不是数组
out: 'wq'
});

注意:

1.mapreduce是根据map函数里调用的emit函数的第一个参数来进行分组的
2.仅当根据分组键分组后一个键匹配多个文档,才会将key和文档集合交由reduce函数处理。例如:

?
1
2
3
4
5
6
7
db.runCommand(
{
mapreduce: 'test' ,
map: function (){emit(this.name.substr(0,3),this);},
reduce: function (key,vals){ return 'wq' ;},
out: 'wq'
});

执行mapreduce命令后,再查看wq表数据:

?
1
2
3
4
5
6
7
8
9
10
11
db.wq. find ()
 
{ "_id" : "mm1" , "value" : "wq" }
{ "_id" : "mm2" , "value" : "wq" }
{ "_id" : "mm3" , "value" : { "_id" : 3, "name" : "mm3" } }
{ "_id" : "mm4" , "value" : { "_id" : 4, "name" : "mm4" } }
{ "_id" : "mm5" , "value" : { "_id" : 5, "name" : "mm5" } }
{ "_id" : "mm6" , "value" : { "_id" : 6, "name" : "mm6" } }
{ "_id" : "mm7" , "value" : { "_id" : 7, "name" : "mm7" } }
{ "_id" : "mm8" , "value" : { "_id" : 8, "name" : "mm8" } }
{ "_id" : "mm9" , "value" : { "_id" : 9, "name" : "mm9" } }

以上所述就是本文的全部内容了,希望大家能够喜欢。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值