最近一直在用mongodb,有时候会需要用到统计,在网上查了一些资料,最适合用的就是用aggregate,以下介绍一下自己运用的心得。
别人写过的我就不过多描述了,大家一搜能搜索到N多一样的,我写一下我的总结。
基础知识
请大家自行查找更多,以下是关键文档。
操作符介绍:
project:包含、排除、重命名和显示字段
p
r
o
j
e
c
t
:
包
含
、
排
除
、
重
命
名
和
显
示
字
段
match:查询,需要同find()一样的参数
limit:限制结果数量
l
i
m
i
t
:
限
制
结
果
数
量
skip:忽略结果的数量
sort:按照给定的字段排序结果
s
o
r
t
:
按
照
给
定
的
字
段
排
序
结
果
group:按照给定表达式组合结果
unwind:分割嵌入数组到自己顶层文件
文档:MongoDB 官方aggregate说明。
相关使用:
db.collection.aggregate([array]);
array可是是任何一个或多个操作符。
group和match的用法,使用过sqlserver,group的用法很好理解,根据指定列进行分组统计,可以统计分组的数量,也能统计分组中的和或者平均值等。
group之前的match,是对源数据进行查询,group之后的match是对group之后的数据进行筛选;
同理,sort,skip,limit也是同样的原理;
1.1 {_id:1,name:”a”,status:1,num:1}
2.2 {_id:2,name:”a”,status:0,num:2}
3.3 {_id:3,name:”b”,status:1,num:3}
4.4 {_id:4,name:”c”,status:1,num:4}
5.5 {_id:5,name:”d”,status:1,num:5}
以下是示例:
应用一:统计name的数量和总数;
db.collection.aggregate([
{
unwind:分割嵌入数组到自己顶层文件 文档:MongoDB 官方aggregate说明。 相关使用: db.collection.aggregate([array]); array可是是任何一个或多个操作符。 group和match的用法,使用过sqlserver,group的用法很好理解,根据指定列进行分组统计,可以统计分组的数量,也能统计分组中的和或者平均值等。 group之前的match,是对源数据进行查询,group之后的match是对group之后的数据进行筛选; 同理,sort,skip,limit也是同样的原理; 1.1 {_id:1,name:”a”,status:1,num:1} 2.2 {_id:2,name:”a”,status:0,num:2} 3.3 {_id:3,name:”b”,status:1,num:3} 4.4 {_id:4,name:”c”,status:1,num:4} 5.5 {_id:5,name:”d”,status:1,num:5} 以下是示例: 应用一:统计name的数量和总数; db.collection.aggregate([ {
group:{_id:"name",count:{
name",count:{
sum:1},total:{
sum:"
s
u
m
:"
num”}}
]);
应用二:统计status=1的name的数量;
db.collection.aggregate([
{match:{status:1}},
{
match:{status:1}}, {
group:{_id:"name",count:{
name",count:{
sum:1}}}
]);
应用三:统计name的数量,并且数量为小于2的;
db.collection.aggregate([
{
group:id:"$name",count:$sum:1, $match:count:$lt:2]);应用四:统计stauts=1的name的数量,并且数量为1的;db.collection.aggregate([ $match:status:1, $group:id:"$name",count:$sum:1, $match:count:1]);多列group,根据name和status进行多列db.collection.aggregate([ $group:id:name:"$name",st:"$status",count:$sum:1]);
g
r
o
u
p
:
i
d
:"
$
n
a
m
e
"
,
c
o
u
n
t
:
$
s
u
m
:
1
,
$
m
a
t
c
h
:
c
o
u
n
t
:
$
l
t
:
2
]
)
;
应
用
四
:
统
计
s
t
a
u
t
s
=
1
的
n
a
m
e
的
数
量
,
并
且
数
量
为
1
的
;
d
b
.
c
o
l
l
e
c
t
i
o
n
.
a
g
g
r
e
g
a
t
e
(
[
$
m
a
t
c
h
:
s
t
a
t
u
s
:
1
,
$
g
r
o
u
p
:
i
d
:"
$
n
a
m
e
"
,
c
o
u
n
t
:
$
s
u
m
:
1
,
$
m
a
t
c
h
:
c
o
u
n
t
:
1
]
)
;
多
列
g
r
o
u
p
,
根
据
n
a
m
e
和
s
t
a
t
u
s
进
行
多
列
d
b
.
c
o
l
l
e
c
t
i
o
n
.
a
g
g
r
e
g
a
t
e
(
[
$
g
r
o
u
p
:
i
d
:
n
a
m
e
:"
$
n
a
m
e
"
,
s
t
:"
$
s
t
a
t
u
s
"
,
c
o
u
n
t
:
$
s
u
m
:
1
]
)
;
project该操作符很简单,
db.collection.aggregate([
{project:{name:1,status:1}}
]);
结果是,只有_id,name,status三个字段的表数据,相当于sql表达式 select _id,name,status from collection
project:{name:1,status:1}} ]); 结果是,只有_id,name,status三个字段的表数据,相当于sql表达式 select _id,name,status from collection
unwind
这个操作符可以将一个数组的文档拆分为多条文档,在特殊条件下有用,本人暂没有进行过多的研究。
以上基本就可以实现大部分统计了,group前条件,group后条件,是重点。