hadoop学习一

最新推荐文章于 2022-12-07 09:21:22 发布

gg__DBA_blog

最新推荐文章于 2022-12-07 09:21:22 发布

阅读量214

点赞数

分类专栏： hadoop

本文链接：https://blog.csdn.net/gg__DBA_blog/article/details/80387799

版权

hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.hadoop是什么
广义是指hadoop生态狭义是指hadoop本身

2.hadoop三大组件是什么?分别做什么
hdfs yarn MapReduce
hdfs是存储数据的，yarn是管理调度作业的，mr是计算处理的

3.hdfs在部署时，要配置信任关系，请问root和hadoop用户部署时，区别是什么
root的权限高，可以不用管，普通用户需要修改autoxx

4.hdfs三个进程是什么
nn，dn，snn

5.一个文件500M，请问多少个块
500/128=3.9 四个块

6.假如副本数为3，上题中的实际存储为多少
3*500=1500M

7.谈谈你们对hdfs读和写流程的理解有什么不一样
读是inputStream
写是outputStream

8.8.nn是做什么的
文件系统的命名空间(包含四个部分)
1.文件名称
2.文件目录结构
3.文件的属性(权限创建时间副本数)
4.文件对应哪些数据块-->数据块对应哪些分布在哪些DN节点上列表

9.dn是做什么的
存储数据块+ 数据块的校验和
与NN通信:
1.每隔3秒发送1次心跳
2.每隔10次心跳发送一次blockReport

10.snn是做什么的
当HA时，SNN不存在了
存储: 命令空间镜像文件fsimage + 编辑日志editlog
作用: 定期合并 fsimage +editlog 为新的fsimage,推送给NN，称为检查点 checkpoint
参数: dfs.namenode.checkpoint.period 3600s

11.谈谈副本放置策略，客户端假如为DN节点，那么第一个副本在哪
就近原则，放当前节点

12.谈谈对jps命令的理解
jps就是把/tmp下对应用户的进程信息显示出来，并不代表实际的进程信息

13.谈谈对pid文件的理解
pid文件记录了进程的ID

14.shell脚本编写第一行是什么
#！/bin/bash

15.怎样动态变量
``
16.if判断要注意什么
if判断里的条件开头和结尾都要空格

17.调试哪两种
sh -x shellName
shell脚本内写 -x

18.root用户想要使用hadoop执行 date命令，请问命令和参数是什么
su - hadoop -c data

gg__DBA_blog

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop学习一

1.hadoop是什么广义是指hadoop生态狭义是指hadoop本身2.hadoop三大组件是什么?分别做什么hdfs yarn MapReducehdfs是存储数据的，yarn是管理调度作业的，mr是计算处理的3.hdfs在部署时，要配置信任关系，请问root和hadoop用户部署时，区别是什么root的权限高，可以不用管，普通用户需要修改autoxx4.hdfs三个进程是什么nn，dn，...
复制链接

扫一扫