浅析mongodb的group分组统计

最新推荐文章于 2024-01-24 11:53:36 发布

woshixianlaid

最新推荐文章于 2024-01-24 11:53:36 发布

阅读量1.8k

点赞数

分类专栏：个人技术工具使用文章标签： mongodb group sql

本文链接：https://blog.csdn.net/woshixianlaid/article/details/79260460

版权

个人技术同时被 2 个专栏收录

44 篇文章 1 订阅

订阅专栏

工具使用

32 篇文章 0 订阅

订阅专栏

group做的聚合有些复杂。先选定分组所依据的键，此后MongoDB就会将集合依据选定键值的不同分成若干组。然后可以通过聚合每一组内的文档，产生一个结果文档。
和数据库一样group常常用于统计。MongoDB的group还有很多限制，如：返回结果集不能超过16M， group操作不会处理超过10000个唯一键，好像还不能利用索引[不很确定]。

Group大约需要一下几个参数。

1.key：用来分组文档的字段。和keyf两者必须有一个
2.keyf：可以接受一个javascript函数。用来动态的确定分组文档的字段。和key两者必须有一个
3.initial：reduce中使用变量的初始化
4.reduce：执行的reduce函数。函数需要返回值。
5.cond：执行过滤的条件。
6.finallize：在reduce执行完成，结果集返回之前对结果集最终执行的函数。可选的。
下面介绍一个实例：
先插入测试数据：

1

2

3

4

 
         for 
         (var i=1; i<20; i++){ 
        
         var num=i%6; 
        
         db. 
         test 
         .insert({_id:i,name: 
         "user_" 
         +i,age:num}); 
        
         }

1.普通分组查询

 
         db. 
         test 
         .group({ 
        
         key:{age: 
         true 
         }, 
        
         initial:{num:0}, 
        
         $reduce: 
         function 
         (doc,prev){ 
        
         prev.num++ 
        
         } 
        
         }); 
        
         db.runCommand({group: 
        
         { 
        
         ns: 
         "test" 
         , 
        
         key:{age: 
         true 
         }, 
        
         initial:{num:0}, 
        
         $reduce: 
         function 
         (doc,prev) 
        
         { 
        
         prev.num++ 
        
         } 
        
         } 
        
         });

2.筛选后再分组

 
         db. 
         test 
         .group({ 
        
         key:{age: 
         true 
         }, 
        
         initial:{num:0}, 
        
         $reduce: 
         function 
         (doc,prev) 
        
         { 
        
         prev.num++ 
        
         }, 
        
         condition:{age:{$gt:2}} 
        
         }); 
        
         db.runCommand({group: 
        
         { 
        
         ns: 
         "test" 
         , 
        
         key:{age: 
         true 
         }, 
        
         initial:{num:0}, 
        
         $reduce: 
         function 
         (doc,prev) 
        
         { 
        
         prev.num++}, 
        
         condition:{age:{$gt:2}} 
        
         } 
        
         });

3、普通的$where查询：

1

2

3

4

 
         db. 
         test 
         . 
         find 
         ({$where: 
         function 
         (){ 
        
         return 
          this.age>2; 
        
         } 
        
         });

group联合$where查询

 
         db. 
         test 
         .group({ 
        
         key:{age: 
         true 
         }, 
        
         initial:{num:0}, 
        
         $reduce: 
         function 
         (doc,prev){ 
        
         prev.num++ 
        
         }, 
        
         condition:{$where: 
         function 
         (){ 
        
         return 
          this.age>2; 
        
         } 
        
         } 
        
         });

4、使用函数返回值分组

 
         // 
         注意，$keyf指定的函数一定要返回一个对象 
        
         db. 
         test 
         .group({ 
        
         $keyf: 
         function 
         (doc){ 
         return 
          {age:doc.age};}, 
        
         initial:{num:0}, 
        
         $reduce: 
         function 
         (doc,prev){ 
        
         prev.num++ 
        
         } 
        
         }); 
        
         db.runCommand({group: 
        
         { 
        
         ns: 
         "test" 
         , 
        
         $keyf: 
         function 
         (doc){ 
         return 
          {age:doc.age};}, 
        
         initial:{num:0}, 
        
         $reduce: 
         function 
         (doc,prev){ 
        
         prev.num++} 
        
         } 
        
         });

5.使用终结器

 
         db. 
         test 
         .group({ 
        
         $keyf: 
         function 
         (doc){ 
         return 
          {age:doc.age};}, 
        
         initial:{num:0}, 
        
         $reduce: 
         function 
         (doc,prev){ 
        
         prev.num++ 
        
         }, 
        
         finalize:  
         function 
         (doc){ doc.count=doc.num;delete doc.num; } 
        
         }); 
        
         db.runCommand({group: 
        
         { 
        
         ns: 
         "test" 
         , 
        
         $keyf: 
         function 
         (doc){ 
         return 
          {age:doc.age};}, 
        
         initial:{num:0}, 
        
         $reduce: 
         function 
         (doc,prev){ 
        
         prev.num++}, 
        
         finalize:  
         function 
         (doc){ doc.count=doc.num;delete doc.num; } 
        
         } 
        
         });

有关MapReduce

 
         // 
         首先插入测试数据 
        
         for 
         (var i=1;i<21;i++) 
        
         { 
        
         db. 
         test 
         .insert({_id:i,name: 
         'mm' 
         +i}); 
        
         } 
        
         // 
         进行mapreduce 
        
         db.runCommand( 
        
         { 
        
         mapreduce: 
         'test' 
         , 
        
         map: 
         function 
         (){emit(this.name.substr(0,3),this);}, 
        
         reduce: 
         function 
         (key,vals){ 
         return 
          vals[0];},  
         // 
         注意：vals是一个Object对象而不是数组 
        
         out: 
         'wq' 
        
         });

注意：

1.mapreduce是根据map函数里调用的emit函数的第一个参数来进行分组的
2.仅当根据分组键分组后一个键匹配多个文档，才会将key和文档集合交由reduce函数处理。例如：

1

2

3

4

5

6

7

 
         db.runCommand( 
        
         { 
        
         mapreduce: 
         'test' 
         , 
        
         map: 
         function 
         (){emit(this.name.substr(0,3),this);}, 
        
         reduce: 
         function 
         (key,vals){ 
         return 
          'wq' 
         ;}, 
        
         out: 
         'wq' 
        
         });

执行mapreduce命令后，再查看wq表数据：

以上所述就是本文的全部内容了，希望大家能够喜欢。

woshixianlaid

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
浅析mongodb的group分组统计

group做的聚合有些复杂。先选定分组所依据的键，此后MongoDB就会将集合依据选定键值的不同分成若干组。然后可以通过聚合每一组内的文档，产生一个结果文档。和数据库一样group常常用于统计。MongoDB的group还有很多限制，如：返回结果集不能超过16M， group操作不会处理超过10000个唯一键，好像还不能利用索引[不很确定]。Group大约需要一下几个参数。 1
复制链接

扫一扫