查询集合operation_log根据params_str字段中org_name进行汇总统计数据。
// 1
{
"_id": ObjectId("6257"),
"params_str": "{'time_begin': '2022-04-21', 'time_end': '2022-04-21', 'org_name': '北京', 'rt_type': 'potential_customer'}"
}
// 2
{
"_id": ObjectId("6258"),
"params_str": "{'time_begin': '2022-04-21', 'time_end': '2022-04-21', 'org_name': '北京', 'rt_type': 'potential_customer'}"
}
// 3
{
"_id": ObjectId("625c"),
"params_str": "{'time_begin': '2022-04-21', 'time_end': '2022-04-21', 'org_name': '北京', 'rt_type': 'potential_customer'}"
}
params_str字段是一个字符串,非json格式,需要处理。
这里只是简单以“,”号分割数据,做简单的汇总查询。
db.operation_log.aggregate(
[
{ "$match": { //过滤条件取params_str不为空的字段
"params_str": {$ne: null}}
}
,
{"$project":{ //使用$split对params_str字段进行切割,得到params的json格式
"params": { "$split": ["$params_str", ","] } }
}
,
{
"$project": {
"params": 1,
// 然后使用$arrayElemAt获得params数组中第三个元素,命名为org
"org": {
"$arrayElemAt": [ "$params",2]
}
}
},
{"$group":{"_id":"$org",count:{$sum:1}} }
]
)
查询结果
{
"_id": " 'org_name': '北京'",
"count": 3
}
查询弊端就是如果前面包含了多个逗号,切分出来第3个元素就不是org_name这个字段,导致统计不对,需要确保元素格式是一致的,起码前面格式是一致的。
https://blog.csdn.net/qq330983778/article/details/106698094