当存储到mongodb中的是string类型的时间,小tips:
1. 那么在对此域按照时间聚类(每周,每月)时就不能直接使用mongodb的time关键字了,因为mongodb有自己的时间类型,且目前它只认可自己的时间类型。
2. 假如对于时间进行简单的聚类,比如按照年,月,日,时,分,秒来聚类,我们可以使用mongodb的substr关键字模拟出mongodb能够认可的时间类型。
比如 2015-03-02 22:53:45 ---> 2014 这样截取出year,2014-03-02就是截取出day。
3. 按照季度或者星期来聚类时就有些麻烦了, 这时需要我们先分别按照月,日来进行一步聚类,将聚类后的中间结果在java中完成二次聚类。比如以星期进行聚类时需要先按照day来取,再结合java的calendar来得出星期
db.myObject.aggregate(
{$project:{new_time_stamp:{$substr:["$time_stamp",0,10]}}},
{$group:{_id:"$new_time_stamp","count":{$sum:1}}});
mongodb聚类
mongodb聚类可分为三个子操作,分别是match, project, group
三个子操作均体现为DBObject类型,aggregation接受List参数,所以允许三个操作并列。
下面是一个例子。
$match: {type: "airfare"}, type 是一个域,而airfare是值,这里要求完全匹配。假如