MongoDb之MapReduce

最新推荐文章于 2024-07-25 11:48:36 发布

xuyanlu

最新推荐文章于 2024-07-25 11:48:36 发布

阅读量937

点赞数

分类专栏： MongoDb 文章标签： Mongo mapreduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jovenlu/article/details/28652855

版权

MongoDb 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

MongoDB中的MapReduce相当于Mysql中的group by，所以在MongoDb上使用Map/Reduce进行并行"统计"比较容易。

使用MapReduce要实现两个函数Map和Reduce函数，Map函数调用emit（key, value），遍历collection中所有记录，将key与value传递给Reduce函数进行处理。Map函数和Reduce函数可以使用javascript来实现。可以通过db.runCommand（）或mapReduce（）命令来执行MapReduce操作。

下列是runCommand（）函数与参数说明

db.runCommand（

'mapreduce':<collectoin>,//要操作的目标集合

'map':<mapfunc>,//映射函数（生成键值对序列，做为reduce函数参考）

'reduce':<reducefunc>//统计函数

[,query:<query filter object>]//目标记录过滤

[,sort:<>]//目标记录排序

[,limit:<number of objects to return form collection>]//限制目标记录数量

[,out:<see output options below>]//统计结果存放集合（不指定则使用临时集合，在客户端断开后自动删除）

[,keeptem:<true|false>]//是否保留临时集合

[,finalize:<finalizeFunc>]//最终处理函数（对reduce返回结果进行最终整理后存入结果集合）

[,scope:<object where fields go into javascript global scope>]//向map/reduce/finalize导入外部变量。

[,verbose:true]//显示详细的时间统计信息

）;

我们先准备一些数据（用php脚本暂时insert十万数据，大概需要8.35秒）：

ini_set（'max_execution_time', 300）是适应浏览器执行时，出现的30秒超时。

接下来，我们利用php来统计uid。（10万条数据，大概耗时7.29秒）

这个脚本大概运行7~8秒钟，我们利用MongoCode（）建立Map和Reduce函数，然后通过out选择建立临时表，在这有我们留下临时表，不做删除。

生成表的数据格式有两个元素，一个uid为_id、另一个是这个uid出现的次数，存在value。

我们再次用insert脚本插入90万数据，弄成100万的数据。这次耗时是1.7min。由此可见，这并不是成线性增长，而是随着数据量增长，时间也在不断的递增，而且单位时间内增长的数据量也会减少。

好，那我们再次执行map脚本，看看需要多长时间。这次大概耗时1分钟20秒左右。

但是如果我们用平常的方法，利用循环、判断、组合来分组的话，耗时已经不仅仅为1分钟了，时间会更长。

所以，在合适的时候用MapReduce会事半功倍的。这只是处理100万的数据，但是如果处理更多的数据时，上千万的数据，也会更节省时间，当然随着数据量的增多，需要注意更多方面的问题，譬如内存是否足够等等。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

xuyanlu CSDN认证博客专家 CSDN认证企业博客

码龄13年

31: 原创

23万+: 周排名

44万+: 总排名

12万+: 访问

: 等级

1483: 积分

172: 粉丝

15: 获赞

10: 评论

5: 收藏

私信

关注

热门文章

分类专栏

PHP 13篇
MySql 8篇
PHPExcel 1篇
JavaScript 6篇
Linux 2篇
github 3篇
算法 3篇
其他 10篇
Oracle 1篇
MongoDb 7篇
PHP脚本 3篇
MySql学习 1篇
JavaScript脚本学习 2篇

最新评论

Mysql安装
qq_16109091: 多谢多谢，解决了我wamp mysql无法启动的问题。
Mysql安装
qq_16109091: 多谢多谢，解决了我wamp mysql无法启动的问题。
Windows下配置多端口的Mysql
忆赋: 不行啊，启动服务的时候报错，1067
windows配置PHP5.5.6+Apache2.4.7
miss_minor: 在尾部加上php LoadModule php5_module "D:/Environment/php-5.5.6-x64/php5apache2_4.dll" PHPIniDir "D:/Environment/php-5.5.6-x64" 这段话的在尾部指的是</IfModule>后面？
windows配置PHP5.5.6+Apache2.4.7
Smile_Lo: 为什么我一修改Apache的httpd.conf文件，Apache就开不了呢？求解脱啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。