初学HDFS分布式存储心得
对于HDFS存储原理的理解
对于分布式存储,拆开就是分布式和存储。首先说分布式,顾名思义,不会把所有的数据放在一起,要分开保存。保存数据的服务器就是所谓的datanode,存储数据的节点。很多台的服务器可以放在一个机架上,机架就是有服务器搭建起来的一个集体。为什么要提到机架?对于数据的保存,首先要考虑的是安全性,将数据备份可以防止数据的丢失。一般的我们将数据备份两份就可以了。使用机架,将数据存储在不同的机架的服务器上,第一个机架的一个服务器放一份数据,第二个机架的两台服务器上放两份数据,如果一个机架或者服务器坏了,可以从其他服务器拷贝。由于机架内部传输数据快,所以不需要三台服务器放到三个机架上。
当数据分布式存储之后,如何读数据以及写数据是一个难题。当我想要得到存储的数据时,直接去服务器上去找无疑是在浪费时间。如果能有一台机器专门按照我的要求去服务器给我找数据就很方便了。这台机器就是我们所说的namenode了,专门接收我的请求,然后由它去给