map/reduce

[align=center][b][size=medium]map函数:[/size][/b] [/align]
它的输入是一个LIST 数据集合;它的输出也是一个LIST数据集合。
该函数中常常是调用内置emit函数,emit函数通常有两个参数(key,value),
map函数最终执行结果是输出一个LIST数据集合,其中每条数据格式必定是emit函数的参数key,value所对应的数据(key,value)。
综合而言,map函数的作用是生成某类doc数据的索引视图,视图中的key 和value 完全可以用emit函数的两个参数来约定。例如:可以用doc.type来指定需要关注的doc数据的类型,然后用doc.id,doc.descript分别作为emit函数的两个参数。那么这个map函数所输出的LIST数据集合中所有的数据的key就是doc.id,value就是doc.descript。
[b]这里需要注意的是:[/b]emit函数的两个参数 key 和 value 并不是一定是doc数据的某个属性,可以是任意属性的组合例如:
1、key 可以是{ "model": doc.model},如果 key 被指定为 doc.id以外的属性的话,其实起着类似SQL中的分组的作用。
2、value 可以是{ "make": doc.make, "model": doc.model, "year":doc.year }。

通俗说 map函数 生成指定类型的文档数据集合所对应的视图,视图的索引ID和其他所需的属性可以在emit函数的参数中指定。

[align=center][b][size=medium]
reduce函数:[/size] [/b][/align]
它的输入有可能是一个LIST 数据集合(来自map函数的输出);如果客户端没有特别要求(不指定group=true),它的输出一定是一条数据。所以说该函数的作用是对数据集做聚集处理。例如总计或求平均值等这样的操作。
这个函数有三个参数:(key, values, rereduce),
根据输入的数据集合的大小,couchDB 在执行reduce函数的时候可以对输入数据集合做分组计算,如果是这样的话,在做分组计算的时候,couchDB会把reduce函数的参数rereduce先设定为false,所有的分组计算完毕后,couchDB会把参数rereduce被设定为true,然后把计算的中间结果作为参数values再次传递给reduce函数计算。

所以,需要注意的是,reduce函数的实际执行过程有以下两种方式:
方式一:在参数rereduce为false的时候,reduce函数的参数(key, values)和map函数的输出是一样的。
方式二:在参数rereduce为true的时候,这时候reduce函数的参数(key, values)不是map函数的输出,具体是这样的:其中:key是null,而values,是上次reduce函数被执行后的输出(分组计算结果)。也就是说只有当reduce函数被调用过至少一次(先做分组运算)的场合,才会发生参数变化的现象。
总结:有的时候,无论参数rereduce为true或是false,最终的结果是一样的。
例如以下数据为map函数的输出
1:1
1:4
1:5

2:3
2:4
2:8

3:9
3:2
3:5
以上数据列可以按照key值,分成三个组(三个组的key可以理解为:1、2、3):
Group A: 1, 4, 5
Group B: 3, 4, 8
Group C: 9, 2, 5
那么,couchDB视图引擎首先在reduce函数
function(key, values, rereduce) {
return sum(values);
}
中执行分组计算(参数rereduce=false)执行,计算结果如下:
1:10
2:15
3:16
然后reduce函数再次被调用(注意:参数rereduce被设定为true)
,reduce函数的最终结果=41。

事实上无论参数rereduce为true或是false,对于这个特殊的reduce函数而言,最终的结果都是41。

[b]特别要说明的是[/b]:如果你是用 couchDB的Futon管理工具执行这样的may/reduce函数的时候,执行结果是(因为Futon自动向couchDB发出带有group=true检索请求):
1:10
2:15
3:16
但是如果你是使用cURL工具的话(不指定group=true),执行的结果是:
41
对于这个特定的求和函数而言,我们期望的结果不是
1:10
2:15
3:16
而是41。
[align=center][b][size=medium]总结[/size][/b][/align]
couchDB map/reduce函数,reduce函数是可选的,而且在实际应用中我们可以控制让reduce函数循环被执行(返回一条数据),也可以只让它执行一次(返回多条数据)。这完全取决我们实际业务需求。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值