大数据的存储方式
大数据存储采用的是分布式存储,之所以用分布式存储,不是因为分布式有多好,而是实在是不用分布式不行啊。大数据,大数据,顾名思义,就是大量数据的集合,远远超出了一台不同服务器中硬盘的承载极限,所以使用分布式完全是被迫的。分布式听起来很高大上,其实特也有很多确定,增加了开发的复杂度,和管理的难度,但是如果不用分布式,连最基本的可用性和稳定性都保证不了,有何谈高效率呢?
何为分布式
我的理解就是将一个大数据的集合拆分成多个小的数据集合分别存储到不同的服务器硬盘中,从而解决空间不足的问题。