mongodb-aggregate（聚合函数）

最新推荐文章于 2024-08-15 11:32:37 发布

九指码农

最新推荐文章于 2024-08-15 11:32:37 发布

阅读量2.8k

点赞数 1

分类专栏： mongodb 学习笔记文章标签： mongodb aggregate mapreduce

本文链接：https://blog.csdn.net/qq_14950717/article/details/52531192

版权

mongodb 学习笔记专栏收录该内容

8 篇文章 0 订阅

订阅专栏

mongodb是有自己的mapreduce的，功能很强大，性能也还好，完成了基本上所有的关系型数据库可以完成的统计工作；但是后来mongodb出现了聚合函数，尝试着代替mapreduce，下面开始介绍聚合函数的使用：
aggregate() 方法

MongoDB中聚合的方法使用aggregate()。
语法

aggregate() 方法的基本语法格式如下所示：

db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)
db.collection.aggregate(pipeline, options);

pipeline Array

与mysql中的字段对比说明

$project又名投射，1表示要返回的字段，0表示不需要返回的字段，在find和aggregate时都可以使用 ===> 返回哪些字段,select,说它像select其实是不太准确的,因为aggregate是一个阶段性管道操作符,$ project是取出哪些数据进入下一个阶段管道操作,真正的最终数据返回还是在group等操作中;

$match # 放在group前相当于where使用,放在group后面相当于having使用
match可以用于某个field对应多个value时的查询 match和in搭配使用。

$sort # 排序1升-1降 sort一般放在group后,也就是说得到结果后再排序,如果先排序再分组没什么意义;$ limit # 相当于limit m,不能设置偏移量
$skip # 跳过第几个文档
limit和skip搭配使用相当于关系型数据库的分页功能；但是skip在数据量比较大的时候，会拖慢性能，后面的文档我会继续介绍，怎么合理的使用（自己欠下的，哈哈）

$unwind # 把文档中的数组元素打开,并形成多个文档,一般用于查询内嵌数组的时候使用，可以获取到内嵌数组文档的每一个值；参考Example1$ group: { _id: <expression>, <field1>: { <accumulator1> : <expression1> }, ... # 按什么字段分组,注意所有字段名前面都要加 $,否则mongodb就为以为不加$ 的是普通常量,其中accumulator又包括以下几个操作符

$sum,$ avg, $first,$ last, $max,$ min, $push,$ addToSet

如果group by null就是 count(*)的效果

db.test.aggregate({_id:null,sum:{“ $sum”:1}}) ==select c ount(*)from table 如果想实现针对某一列求和，而此时却没有比较好的的分组字段，此时可以使用： db.test.aggregate({_id:null,sum:{“$ sum":"$field”}})
实例

集合中的数据如下：
{
_id: ObjectId(7df78ad8902c)
title: ‘MongoDB Overview’,
description: ‘MongoDB is no sql database’,
by_user: ‘w3cschool.cc’,
url: ‘http://www.w3cschool.cc‘,
tags: [‘mongodb’, ‘database’, ‘NoSQL’],
likes: 100
},
{
_id: ObjectId(7df78ad8902d)
title: ‘NoSQL Overview’,
description: ‘No sql database is very fast’,
by_user: ‘w3cschool.cc’,
url: ‘http://www.w3cschool.cc‘,
tags: [‘mongodb’, ‘database’, ‘NoSQL’],
likes: 10
},
{
_id: ObjectId(7df78ad8902e)
title: ‘Neo4j Overview’,
description: ‘Neo4j is no sql database’,
by_user: ‘Neo4j’,
url: ‘http://www.neo4j.com‘,
tags: [‘neo4j’, ‘database’, ‘NoSQL’],
likes: 750
},
现在我们通过以上集合计算每个作者所写的文章数，使用aggregate()计算结果如下：

db.mycol.aggregate([{ $group : {_id : "$ by_user", num_tutorial : {$sum : 1}}}])
{
“result” : [
{
“_id” : “w3cschool.cc”,
“num_tutorial” : 2
},
{
“_id” : “Neo4j”,
“num_tutorial” : 1
}
],
“ok” : 1
}

以上实例类似sql语句： select by_user, count(*) from mycol group by by_user
在上面的例子中，我们通过字段by_user字段对数据进行分组，并计算by_user字段相同值的总和。下表展示了一些聚合的表达式:
表达式描述实例
$sum 计算总和。 db.mycol.aggregate([{$ group : {_id : " $by_user", num_tutorial : {$ sum : "$likes”}}}])