hadoop 学习历程二

hadoop生态圈:

Common 一组分布式文件系统和通用i/o的组件接口(序列化,java rpc 和持久化数据结构)

Avro 一种支持高效,跨语言的RPC以及永久存储数据的序列化系统

MapReduce 分布式数据处理模型和执行环境,运行于大型商用机集群

HDFS 分布式文件系统 运行于大型商用机集群

Pig 一种数据流语言和运行环境,用以检索非常大的数据集。比如运行在MapReduce和HDFS集群上

Hive 一个分布式,按列存储数据库。Hive管理HDFS中存储的数据,并提供基于sql的查询语言(运行时引擎翻译成MapReduce作业)用以查询数据。

Hbase 一个分布式,按列存储数据库。Hbase使用HDFS作为底层存储,同时支持MapReduce的批量式计算和点查询(随机读取)

Zookeeper 一个分布式、可用性高的协调服务。Zookeeper提供了分布式锁之类的基本服务用于构建分布式应用

Sqoop 在数据库和HDFS之间高效传输数据的工具

-----------------------------------------------------------------

hadoop  2.0.3 和网上介绍的版本有点不一样

它的config文件是在etx里面。startall 是在sbin里面

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值