mongoDB的map reduce

最新推荐文章于 2021-12-21 16:32:34 发布

GP0071

最新推荐文章于 2021-12-21 16:32:34 发布

阅读量1.5k

点赞数

分类专栏： MongoDB MongoDB 文章标签： mongodb

本文链接：https://blog.csdn.net/gaopeng0071/article/details/39500449

版权

MongoDB 同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

MongoDB

16 篇文章 1 订阅

订阅专栏

mongoDB的map reduce使用

示例：

res = db.runCommand({
mapreduce:'liveEpgUserVisits',
map:function() {
emit({provice:this.provice}, {"data":[{"mac":this.mac}],visit:this.visitNum, userCount:0});
},
reduce:function(key, value) {
var ret = {data:[]}, visit=0
var userCount=0;
var macs = {};
var sum = 0;
for(var i in value) {
var ia = value[i];
for(var j in ia.data) {
if(!macs[ia.data[j].mac]) {
macs[ia.data[j].mac] = true;
ret.data.push(ia.data[j]);

userCount += 1;

}
}

sum += Number(ia.visit);
}
ret.visit = sum;
ret.userCount = userCount;
return ret;
},
query:{"inputTime":{$gte:ISODate("2014-09-17T14:20:00Z"),$lte:ISODate("2014-09-17T14:30:00Z")}},
finalize:function(key, values){
return [{count:values.data.length},{visit:values.visit},{userCount:values.userCount}];
},
out:'tmp_mo_spcode_consignid_1',
verbose:true
})

上面的示例，

map：key是省份，value是这个省份对应的mac值、访问数量、用户数量。

reduce：获取到每个省份的value，然后进行运算，在将结果返回。

通过finalize参数指定输出格式。如果不指定输出格式则会安装map的key和value格式进行输出。

其中db.runCommand包含以下参数：

db.runCommand(

{ mapreduce : <collection>,

map : <mapfunction>,

ion> [, query : <query fi

reduce : <reducefunc
tlter object>]

ort the query. useful for optimization>] [, limit :

[, sort : <
s<number of objects to return from collection>]

temp: <true|false>] [, finalize :

[, out : <output-collection name>] [, kee
p<finalizefunction>]

where fields go into javascript global scope >] [, verbose : true

[, scope : <objec
t] } );

   
   
    
    
     
         - mapreduce：指定要进行mapreduce处理的collection

    
    
    
    
     
         - map：map函数
    
    
    
    
     
         - reduce：reduce函数
    
    
    
    
     
         - out：输出结果的collection的名字，不指定会默认创建一个随机名字的collection（如果使用了out选项，就不必指定keeptemp：true了，因为已经隐含在其中了）
    
    
    
    
     
         - query：一个筛选条件，只有满足条件的文档才会调用map函数。（query。limit，sort可以随意组合）
    
    
    
    
     
         - sort：和limit结合的sort排序参数（也是在发往map函数前给文档排序），可以优化分组机制
    
    
    
    
     
         - limit：发往map函数的文档数量的上限（要是没有limit，单独使用sort的用处不大）
    
    
    
    
     
         - keytemp：true或false，表明结果输出到的collection是否是临时的，如果想在连接关闭后仍然保留这个集合，就要指定keeptemp为true，如果你用的是MongoDB的mongo客户端连接，那必须exit后才会删除。如果是脚本执行，脚本退出或调用close会自动删除结果collection
    
    
    
    
     
         - finalize：是函数，它会在执行完map、reduce后再对key和value进行一次计算并返回一个最终结果，这是处理过程的最后一步，所以finalize就是一个计算平均数，剪裁数组，清除多余信息的恰当时机
    
    
    
    
     
         - scope：javascript代码中要用到的变量，在这里定义的变量在map，reduce，finalize函数中可见
    
    
    
    
     
         - verbose：用于调试的详细输出选项，如果想看MpaReduce的运行过程，可以设置其为true。也可以print把map，reduce，finalize过程中的信息输出到服务器日志上。