- 博客(1)
- 资源 (10)
- 收藏
- 关注
Hadoop开发者入门
、hadoop的体系结构
NameNode - 主节点 主服务器
SecondaryNameNode – 是辅助nameNode
DataNode -数据保存用的
TaskTracker – 接收任务
JobTracker - 分数据 -100M Datanode1,DataNode2,DataNode3
2014-08-04
hadoop的经典讲义
、hadoop的组成
hadoop Common – 是hadoop的核心,包括文件系统、远程调用RPC的序列化函数。
HDSF : 提供高吞吐量的可靠分布式文件系统是 GFS的开源实现。
•Hadoop的文件系统。必须通过hadoop fs 命令来读取。支持分布式。
MapReduce : 大型分布式数据处理模型,是Google MapReduce的开源实现。
•合并/计算模型。
其他相关组成:
•Hbase:结构化分部式数据库。BigTable的开源实现。
•Hive:提供摘要和查询功能的数据仓库。
•Cassandra:由Facebook开发分布式数据仓库。目前已经捐献给apache。且apache已经将Cassandra应用到了各种云计算系统中。
2014-08-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人