java程序猿hadoop之路每日一小时

1、基础概念:hadoop是适合大数据的分布式存储计算的平台。

2、硬件和软件要求:

           服务器:EXSI,可以部署多个虚拟机

           PC:Linux,windows+Cygwin

           SSH:客户端 SecurtCRT

           Vmware clinet: 管理Esxi

3、所用框架

主框架:

(核心项目)HDFS:文件系统,用来存储文件

(核心项目)MapReduce:并行计算HDFS中的数据

Hbase:分布式按列存储数据库,能够快速响应

Hive:分布式按列存储数据仓库,让hadoop能够支持sql,使用面广,但是要求较高,

      pig:与hive相似用来处理数据,但是实现方式是按照步骤一步一步实现

4、hadoop优点:

1)扩容能力强:能够存储够大的数据

2)成本低:可以用多个普通服务器来构建一个强大的服务器

3)效率高:同一批数据可以并行处理

4)可靠性:能够自动维护


HDFS架构:

主从结构

     主节点:只有一个:namenode

接收用户操作请求

维护文件系统的目录结构

管理文件和block(块)之间的关系,block与datanode之间的关系

     从节点:有很多个:datanodes

存储文件

文件被分成block存储在磁盘上

保证数据安全,文件有副本


MapReduce架构:

主从结构

主节点:只有一个:JobTracker

接收用户提交的计算任务

把计算任务分给TaskTrackers执行

监控TaskTracker的执行情况

从节点,有很多个:TaskTrackers

执行JobTracker分配的计算任务




5、部署方式

本地模式:直接存储在linux磁盘上,不存HDFS上

伪分布模式:一台机器上,其他与集群类似

集群模式:







  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值