MongoDB:MapReduce聚合

最新推荐文章于 2023-12-20 11:02:57 发布

上官焱阳

最新推荐文章于 2023-12-20 11:02:57 发布

阅读量273

点赞数

分类专栏： mongo mapReduce

本文链接：https://blog.csdn.net/zyl20120102010/article/details/76531065

版权

MapReduce是个非常灵活和强大的数据聚合工具。它的好处是可以把一个聚合任务分解为多个小的任务，分配到多服务器上并行处理。

MongoDB也提供了MapReduce，当然查询语肯定是JavaScript。MongoDB中的MapReduce主要有以下几阶段：

1. Map:把一个操作Map到集合中的每一个文档

2. Shuffle: 根据Key分组对文档，并且为每个不同的Key生成一系列(>=1个)的值表(List of values)。

3. Reduce: 处理值表中的元素，直到值表中只有一个元素。然后将值表返回到Shuffle过程，循环处理，直到每个Key只对应一个值表，并且此值表中只有一个元素，这就是MR的结果。

4. Finalize：此步骤不是必须的。在得到MR最终结果后，再进行一些数据“修剪”性质的处理。

MongoDB中使用emit函数向MapReduce提供Key/Value对。

Reduce函数接受两个参数：Key,emits. Key即为emit函数中的Key。 emits是一个数组，它的元素就是emit函数提供的Value。

Reduce函数的返回结果必须要能被Map或者Reduce重复使用，所以返回结果必须与emits中元素结构一致。

Map或者Reduce函数中的this关键字，代表当前被Mapping文档。

实例

一、测试数据: 这个集合是三个用户购买的产品和产品价格的数据。

 
  for(var i=0;i<1000;i++){ 
var rID=Math.floor(Math.random()*10); 
var priceparseFloat((Math.random()*10).toFixed(2)); 
if(rID<4){ 
    db.test.insert({"user":"Joe","sku":rID,"price":price}); 
} 
else if(rID>=4 && rID<7)
{ 
   db.test.insert({"user":"Josh","sku":rID,"price":price}); 
} 
else {  
db.test.insert({"user":"Ken","sku":rID,"price":price}); 
     } 
} 
 

1. 每个用户各购买了多少个产品&#x

最低0.47元/天解锁文章

上官焱阳

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MongoDB:MapReduce聚合

MapReduce是个非常灵活和强大的数据聚合工具。它的好处是可以把一个聚合任务分解为多个小的任务，分配到多服务器上并行处理。MongoDB也提供了MapReduce，当然查询语肯定是JavaScript。MongoDB中的MapReduce主要有以下几阶段： 1. Map:把一个操作Map到集合中的每一个文档 2. Shuffle: 根据Key分组对文档，并且为每
复制链接

扫一扫