关键字:嵌套 多层嵌套 子文档 聚集运算 分组
MongoDB 嵌套结构的数据非常常见, 它通过嵌套子文档,达到一对多的关联关系。但嵌套结构中按分类分组求子文档的数据计算,不能直接通过 $group 聚集运算来实现,需要将嵌套结构解开,由多层嵌套结构变成多条单层结构来计算,由于中间过程的处理,且还要借且其它函数辅助实现输出。下面以集合 order 为例说明,按 category 分组获取 term 的数量并按由大到小的顺序输出。
[
{ category: "movies",
terms: [{ term: "movie 1", total: 1000}, {term: "movie 2", total: 100} ]
},
{ category: "sports",
terms: [{ term: "football 1", total: 1000}, {term: "tennis 2", total: 120} ]
},
{ category: "movies",
terms: [{ term: "movie 1", total: 5000}, {term: "movie 2", total: 200},
{term: "movie 3", total: 280} ]
},
{ category: "sports",
terms: [{ term: "football 1", total: 4000}, {term: "tennis 2", total: 250},
{term: "tennis 2", total: 450} ]
},
]
MongoDB通过聚集运算 aggregate,group 实现如下:
db.order.aggregate([
{$unwind : "$terms"},
{ $group : { _id : {
category: "$category",
term: "$terms.term" },
total: {$sum : "$terms.total"}
}
},
{$sort : { total : -1} },
{ $project: {
_id: 0,
category: "$_id.category",
term: "$_id.term",
total:1}}
])
$unwind将 terms数组拆分成多条, 再由 $group 分组、求和、排序后,最后用 $project过滤字段输出。
如果有集算器协助 MongoDB,就不需要这么繁琐的组合运算:
A | |
1 | =mongo_open("mongodb://127.0.0.1:27017/raqdb") |
2 | =mongo_shell(A1,"order.find()").fetch() |
3 | =A2.conj(terms.derive(A2.category)) |
4 | =A5.group(category,term;~.sum(total):total).sort(-total) |
5 | >A1.close() |
集算器 SPL 不仅对解决嵌套分组,对 MongoDB 很多困难的计算都有帮助,可以参考《 辅助 MongoDB 计算》。
SPL 也能很方便地嵌入到 JAVA 应用,可参考 《Java 如何调用 SPL 脚本》
具体使用方法可参考《如何使用集算器》。