大数据
Paul_Joo
这个作者很懒,什么都没留下…
展开
-
MapReduce
1 问题的出现 多年来磁盘存储容量快速增加的同时,其访问速度-磁盘数据读取速度-却未能与时俱进。 读取一个磁盘中所有的数据需要很长的时间,写甚至更慢。一个很简单的减少读取时间的办法是同时从多个磁盘上读取数据。试想,如果我们拥有100个磁盘,每个磁盘存储1%的数据,并行读取,那么不到两分钟就可以读取所有数据。 MapReduce提出了一个编程模型,该原创 2014-12-18 15:41:22 · 436 阅读 · 0 评论 -
MongoDB
背景开始时只有很少的数据,一台服务器就可以了。然后就得建立备份,以便应对大量的读取和不时的宕机。用不了多长时间,就得加一个缓存层,调整所有的查询,投入更多的硬件。 最后,你会发现自己需要将数据切分到多个集群中,并重新构建大量的应用逻辑以适应这种切分。之后不久,你又会发现被自己数月前设计的数据库结构限制住了。 这是应为集群中大量的数据需要更改模式,会花费很长时间,也需要DBA投入相当多的宝贵时间。原创 2015-08-13 13:31:33 · 345 阅读 · 0 评论