比较常用的有:
•$project - 可以重构数据
•$match - 可以实现类似query的功能
•$limit - 限制返回个数
•$skip - 同上
•$unwind - 可以将一个包含数组的文档切分成多个, 比如你的文档有数组字段 A, A中有10个元素, 那么 经过 $unwind处理后会产生10个文档,这些文档只有 字段 A不同
•$group - 统计操作, 还提供了一系列子命令
–$avg, $sum …
•$sort - 排序
接下来要实现4个功能:
task 1:统计上海学生平均年龄
从这个需求来讲,要实现功能要有几个步骤: 1. 找出上海的学生. 2. 统计平均年龄 (当然也可以先算出所有省份的平均值再找出上海的)。
select province, avg(age)
from student
where province = '上海'
group by province
java代码:
/*创建 $match, 作用相当于query*/
DBObject match = new BasicDBObject("$match", new BasicDBObject("province", "上海"));
/* Group操作*/
DBObject groupFields = new BasicDBObject("_id", "$province");
groupFields.put("AvgAge", new BasicDBObject("$avg", "$age"));
DBObject group = new BasicDBObject("$group", groupFields);
/* 查看Group结果 */
AggregationOutput output = connection.aggregate(match, group); // 执行 aggregation命令
System.out.println(output.getCommandResult());
输出结果:
"result" : [
{ "_id" : "上海" , "AvgAge" : 32.09375}
] ,
"ok" : 1.0
task2:统计每个省各科平均成绩
首先更具数据库文档结构,subjects是数组形式,需要先分组,然后再进行统计
主要处理步骤如下:
1.先用$unwind 拆数组 2. 按照 province, subject 分租并求各科目平均分
/* 创建 $unwind 操作, 用于切分数组*/
DBObject unwind = new BasicDBObject("$unwind", "$subjects");
/* Group操作*/
DBObject groupFields = new BasicDBObject("_id", new BasicDBObject("subjname", "$subjects.name").append("province", "$province"));
groupFields.put("AvgScore", new BasicDBObject("$avg", "$subjects.scores"));
DBObject group = new BasicDBObject("$group", groupFields);
/* 查看Group结果 */
AggregationOutput output = connection.aggregate(unwind, group); // 执行 aggregation命令
System.out.println(output.getCommandResult());
输出结果:
"result" : [
{ "_id" : { "subjname" : "英语" , "province" : "海南"} , "AvgScore" : 58.1} ,
{ "_id" : { "subjname" : "数学" , "province" : "海南"} , "AvgScore" : 60.485} ,
{ "_id" : { "subjname" : "语文" , "province" : "江西"} , "AvgScore" : 55.538} ,
{ "_id" : { "subjname" :