MongoDB——aggregate聚合优化技巧

最新推荐文章于 2024-05-29 11:42:27 发布

且走且珍惜

最新推荐文章于 2024-05-29 11:42:27 发布

阅读量6.2k

点赞数 2

分类专栏： MongoDB 文章标签： MongoDB

本文链接：https://blog.csdn.net/CS_liuqing/article/details/79418602

版权

MongoDB 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

此文章简要介绍MongoDB聚合的技巧，第二条的技巧思路也可以适用于MapReduce统计过程。

按天统计数据

db.test.aggregate([
    {"$project" : { "newTime" : {"$add" : ["$originalTime" , 1000 * 60 * 60 * 8] } , "newAccountTime" : 1, "otherField" : 1} },
    {"$group" : {
        "_id" : {
            "year" : {"$year" : "$newTime" }, "month" : {"$month" : "$newTime"} , "day" : {"$dayOfMonth" : "$newTime"} ,
                "timeStr" : {"$substr" : ["$newTime", 0, 10 ] } , "otherField" : "$otherField"
            }
        }
    },
    // ....
    {"$sort" : {"year" : 1, "month" : 1, "day" : 1}}
])

将按不同的key聚合语句，合并为一条

其思路也可以用到MapReduce处理流程。
在某些情况下，需要统计每个比赛模式的玩家综合数据，也需要统计每个玩家在不同比赛模式的数据。
例如，有”排位模式“、”大乱斗模式“、”休闲模式“等。需要统计各个游戏模式下，玩家参与数、胜率等数据。这样统计需要以gameId作为聚合的key。
同时，也需要统计各个玩家在不同“排位模式”、“休闲模式”的参与次数、胜率等。这样统计需要以玩家的userId作为聚合的key。
解决思路：

按gameId和userId进行group。
对上一步的gameId进行group，同时将userId push 到数组里面。这样就得到第一个要求的数据，且将玩家的信息保存下来了。
对上一步的数组用unwind进行拆分
对上一步的拆分结果的userId进行group。这样每个userId聚合的结果也带了游戏模式的统计结果。
进行过滤处理。

经测试，这样只读取了一次数据库，中间过程对内存的要求比较高，需要开启allowDiskUse选项，一次聚合比两次聚合效率高很多。

参考代码：

global.ldb.collection("grandLog").aggregate([
    // ....
        {"$group" : {"_id" :{"gameId" : "$gameId", "userId" : "$userId"} , "otherField" : "$otherField" } },
        {"$group" : {
            "_id" : "$_id.gameId", "userCount" : {"$sum" : 1} ,
                "userInfo" : {"$push" : {"userId" : "$_id.userId" ,"otherField" : "$otherField"} }
            }
        },
        {"$unwind" : "$userInfo"},
        {"$group" : {"_id" :"$userInfo.userId", "gameId" : {"$push" : "$_id"},
            "userCount" : {"$push" : "$userCount" } }
        }
], {"allowDiskUse" : true } );

也可以根据业务数据将group的两个步骤颠倒。

且走且珍惜

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
MongoDB——aggregate聚合优化技巧

此文章简要介绍MongoDB聚合的技巧，第二条的技巧思路也可以适用于MapReduce统计过程。按天统计数据db.test.aggregate([ {"$project" : { "newTime" : {"$add" : ["$originalTime" , 1000 * 60 * 60 * 8] } , "newAccountTime" : 1, "otherField" :
复制链接

扫一扫

专栏目录