我折腾这个的原因:
- 大数据量的存储;
- 海量数据的分析
但是目前看来,存储的问题上不大,但是mongdb那些特性对于我的#大数据#上没有适配的地方
而另外一个重中之重就是数据统计和分析,这是我的需求核心,我需要对海量数据进行查询统计,太多的group by之类的了
而mongodb似乎不能满足我的要求(或者我不知道),我只是在各种mongodb的资料中只是看到了简单的条件型select
我需要的是海量数据的真正分布式计算型数据库!例如我有1TB数据。可能同时同步存储在4个数据节点上,当我要做某个统计分析的时候,我需要这个统计分析可以被转化下去到这四个节点上然后再汇总。这样的分布式计算提升我单节点计算的性能!
PS,我对于那个Map/Reduce还是有点搞不清楚状态!我再去查查资料!
查了一下资料,好像所谓的MapReduce可以满足我的分布式需求,可是Group之类的呢?
事务我是不需要的。但是MongoDB的查询确实太麻烦了!