Hadoop基础知识点(一)

Hadoop

HDFS介绍:

Hadoop是一个分布式系统基础架构,源于Google的GFS论文(Hadoop Distributed File System),简称HDFS,易于扩展的文件分布式系统,运行在大量普通廉价机机器上,提供容错机制为大量用户提供性能不错的文件存取服务。

Hadoop三大核心: HDFS、MapReduce、YARN

Hadoop四大模块:

  • Hadoop common:为其他Hadoop模块提供基础设施
  • Hadoop DFS:应该高可靠、高吞吐量的分布式文件系统
  • Hadoop MapReduce:一个分布式并行离线计算框架
  • Hadoop YARN:一个新的MapReduce框架,任务调度与资源管理

设计目标

  1. 自动快速检测应对硬件错误
  2. 流式访问数据
  3. 移动计算比移动数据本身更划算(IO)
  4. 简单一致性模型
  5. 异构平台可移植

HDFS特点:

  • 优点:
  1. 高可靠性:按位存储和处理数据的能力值得信赖
  2. 高扩展性:存储计算资源不够时,可以横向的线性扩展机器,一个机器中可以包含数以千计的节点
  3. 高效性:能够在节点之间动态的移动数据,并保证各个节点的动态平衡,因此处理速度非常快
  4. 高容错性:能够自动保存数据的多个副本,并且能自动将失败的任务重新分配
  • 缺点:
  1. 不适合低延迟数据访问
  2. 无法高效存储大量小文件
  3. 不支持多用户写入及任意修改文件

HDFS架构图

HDFS架构图

  1. 存储数据要进行块的切分
  2. 切分块是在client端
  3. 切分大小128M(hadoop2.) 64(hadoop.
  4. 上传数据的时候,每个block只上传一次
  5. 默认副本数为3,会在集群中进行集群内的复制

name启动流程

  1. fsimage是一个镜像文件,这个文件在hdfs开启的时候说空的,edits日志文件也是空的
  2. 在存储文件的时候会将文件写入到edits中
  3. namenode在启动时会将edits文件和fsimage文件进行合并,将合并的结果放入内存中
  4. 在namenode启动时候,写入的元数据信息会写在edits日志文件中做为备份,内存中也写入一份
  5. secondaryNamenode要在指定的时间点将namenode中的fsimage和edits文件进行合并
  6. fsimage文件可以直接加载到内存中
  7. edits日志文件要加载,必须重新演播一遍
  8. 所以secondaryNamenode定期从namenode中以HTTP get方式进行数据的复制
  9. 复制的数据就新建一个edits_new
  10. 将fsimage和edits复制过来进行合并
  11. 将数据发送到NameNode中进行替换

Hadoop Safe Mode

  1. 查询当前是否安全模式
    Hadoop dfsadmin -safemode get
    safe mode is ON
  2. 等待safemode关闭,以便后续操作
    hadoop dfsadmin -safemode wait
  3. 退出安全模式
    hadoop dfsadmin -safemode leave
    safe mode is OFF
  4. 设置用户safemode
    hadoop dfsadmin -safemode enter
    safe mode is ON

配置完hdfs配置文件 需要先进行格式化
格式化:hdfs namenode -format

hadoop HDFS命令(hdfs dfs -命令)hadf dfs -cat /file.txt

cat :				查看
checksum :			校验和
cp :				复制
copyFromlocal :		从本地复制
copyTolocal :		复制到本地

mv :				移动
moveFromlocal :		从本地移动
moveTolocal :		移动到本地
count :				计数
df :				查看文件信息
du :				查看文件大小
ls :				查看列表
put :				从本地复制(copyFromlocal)
get :				复制文件到本地(copyTolocal)
mkdir :				创建目录
rm :				删除
tail :				查看最后10行
touchz :			创建空文件
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值