大数据面试题分享

388人阅读 评论(0) 收藏 举报
分类:

1.Hadoop集群可以运行的3个模式?


单机(本地)模式
伪分布式模式
全分布式模式

2.  单机(本地)模式中的注意点?

在单机模式(standalone)中不会存在守护进程,所有东西都运行在一个JVM上。这里同样没有DFS,使用的是本地文件系统。单机模式适用于开发过程中运行MapReduce程序,这也是最少使用的一个模式。

3.  伪分布模式中的注意点?

伪分布式(Pseudo)适用于开发和测试环境,在这个模式中,所有守护进程都在同一台机器上运行。

4.  VM是否可以称为Pseudo

不是,两个事物,同时Pseudo只针对Hadoop

5.  全分布模式又有什么注意点?

全分布模式通常被用于生产环境,这里我们使用N台主机组成一个Hadoop集群,Hadoop守护进程运行在每台主机之上。这里会存在Namenode运行的主机,Datanode运行的主机,以及task tracker运行的主机。在分布式环境下,主节点和从节点会分开。

6.  Hadoop是否遵循UNIX模式?

是的,在UNIX用例下,Hadoop还拥有“conf”目录。

7.  Hadoop安装在什么目录下?

ClouderaApache使用相同的目录结构,Hadoop被安装在cd/usr/lib/hadoop-0.20/

8.  NamenodeJob trackertask tracker的端口号是?

Namenode70Job tracker30Task tracker60

9.  Hadoop的核心配置是什么?

Hadoop的核心配置通过两个xml文件来完成:1hadoop-default.xml2hadoop-site.xml。这些文件都使用xml格式,因此每个xml中都有一些属性,包括名称和值,但是当下这些文件都已不复存在。

10.  那当下又该如何配置?

Hadoop现在拥有3个配置文件:1core-site.xml2hdfs-site.xml3mapred-site.xml。这些文件都保存在conf/子目录下。

11.  RAM的溢出因子是?

溢出因子(Spill factor)是临时文件中储存文件的大小,也就是Hadoop-temp目录。

12.  fs.mapr.working.dir只是单一的目录?

fs.mapr.working.dir只是一个目录。

13.  hdfs-site.xml3个主要属性?


dfs.name.dir决定的是元数据存储的路径以及DFS的存储方式(磁盘或是远端)
dfs.data.dir决定的是数据存储的路径
fs.checkpoint.dir用于第二Namenode

14.  如何退出输入模式?

退出输入的方式有:1,按ESC2,键入:q(如果你没有输入任何当下)或者键入:wq(如果你已经输入当下),并且按下Enter

15.  当你输入hadoopfsck /造成“connection refused java exception’”时,系统究竟发生了什么?

这意味着Namenode没有运行在你的VM之上。

查看评论

大数据相关面试题整理-带答案-难一点

1、fsimage和edit的区别?  大家都知道namenode与secondary namenode 的关系,当他们要进行数据同步时叫做checkpoint时就用到了fsimage与edit,fs...
  • wdr2003
  • wdr2003
  • 2018-03-19 06:58:03
  • 280

大数据面试题以及答案整理(一)

在进行大数据工作的面试中,将面试问题进行了汇总,然后对答案进行了整理。...
  • godblesspl
  • godblesspl
  • 2018-02-27 22:27:40
  • 3730

hadoop面试题

  • 2014年12月03日 00:46
  • 410KB
  • 下载

大数据面试题及答案 2018

1.   java内存模型2.gc3.编译好的scala程序,运行时还需要scala环境吗Scala的代码执行是用REPL过程,ReadExecute Print Loop4.object中有哪些方法...
  • qianfeng_dashuju
  • qianfeng_dashuju
  • 2018-02-28 17:14:21
  • 465

大数据工程师面试题(七)

9. 面试问题: 1.从前到后从你教育背景(学过哪些课)到各个项目你负责的模块,问的很细(本以为他是物理学博士,但是所有的技术都懂) 2.hadoop 的 namenode 宕机,怎么解决 ...
  • u011682879
  • u011682879
  • 2017-02-26 10:02:59
  • 13889

java 大数据方面面试题_2

1.String 和StringBuffer的区别 JAVA平台提供了两个类:String和StringBuffer,它们可以储存和操作字符串,即包含多个字符的字符数据这个String类提供...
  • qq_24037959
  • qq_24037959
  • 2016-07-07 10:23:54
  • 3766

大数据面试-04-大数据工程师面试题

2.23. 我们开发job时,是否可以去掉reduce阶段。 可以。设置reduce数为0 即可。 2.24. datanode在什么情况下不会备份 datanode在强制关闭或者非正常断电不会...
  • qq_21383435
  • qq_21383435
  • 2018-01-12 15:26:24
  • 975

大数据常见面试题汇总(一)

大数据常见面试题汇总(一)
  • high2011
  • high2011
  • 2016-06-06 13:47:33
  • 20788

京东商城大数据面试题

京东商城 - 大数据(1) Java篇 1、JVM,GC(算法,新生代,老年代),JVM结构 2、hashcode,hashMap,list,hashSet,equals(结构原理),A exten...
  • qq_26442553
  • qq_26442553
  • 2017-12-05 12:42:08
  • 1678

大数据策略——如何成功使用大数据与10个行业案例分享

  • 2016年07月08日 11:34
  • 13.64MB
  • 下载
    个人资料
    专栏达人 持之以恒
    等级:
    访问量: 56万+
    积分: 5486
    排名: 6072
    博客专栏
    最新评论