1、hadoop与云计算之间的关系?
解析:云计算由位于网络上的一组服务器把其计算、存储、数据等资源以服务的形式提供给请求者以完成信息处理任务的方法和过程。针对海量文本数据处理,为实现快速文本处理响应,缩短海量数据为辅助决策提供服务的时间,基于Hadoop云计算平台,建立HDFS分布式文件系统存储海量文本数据集,通过文本词频利用MapReduce原理建立分布式索引,以分布式数据库HBase存储关键词索引,并提供实时检索,实现对海量文本数据的分布式并行处理。所以,Hadoop是云计算的部分构建。
2、hadoop2.0的核心组成部分有哪些?
Hadoop 的生态系统核心组成部分如下图所示:
3、hdfs1.0基本架构组成?
HDFS架构包括: HDFS Client、NameNode、DataNode和Secondary NameNode
4、hdfs读数据流程?
hdfs读取数据流程图:
1、首先调用FileSystem对象的open方法,其实获取的是一个DistributedFileSystem的实例。
2、DistributedFileSystem通过RPC(远程过程调用)获得文件的第一批block的locations