大数据面试100题

1.列出安装Hadoop流程步骤

a) 创建hadoop账号

b) 更改ip

c) 安装Java 更改/etc/profile 配置环境变量

d) 修改host文件域名

e) 安装ssh 配置无密码登录

f) 解压hadoop

g) 配置hadoop  conf下面的配置文件

h) Hadoop namenode -format  格式化

i) Start 启动

2.列出hadoop集群启动中的所有进程和进程的作用

a) Namenode 管理集群  记录namenode文件信息

b) Secondname 可以做备份  对一定范围内的数据做快照

c) Datanode  存储数据

d) Jobtarcker 管理任务  分配任务

e) Tasktracker   执行任务

3.启动报nameNode错误 如何解决

a) 检查hdfs有没有启动成功

b)  检查输入文件是不是存在

4.写出下列执行命令 

杀死一个job

Hadoop job -list  取得job id

Hadoop job kill job id

删除hdfs上的 /temp/aa 目录

Hadoop -daemonSh start datanode 

加入一个新的节点或删除一个节点    刷新集群状态的命令


5.列出你所知道的调肚脐  说明其工作方法

a) Fifo schedular 默认的调肚脐  先进先出

b) Capacity schedular  计算能力调肚脐  选择占用内存小  优先级高的

c) Fair schedular 调肚脐  公平调肚脐  所有job 占用相同资源

6.列出开发map/reduce 元数据存储

a) 

7.用你最熟悉的语言辨析一个map reduce 计算第四个原色的个数

a) Wordcount  

8.你认为java streating pipe 开发map reduce 优缺点

a) Java 编写map reduce可以实现复杂的逻辑  如果需求简单  则显得繁琐

b) Hivesql  基本都是针对 Hive 中表数据进行编写  对复杂的逻辑很难实现




  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值