大数据面试题

1、mapreduce的大致流程

2、列出正确的hadoop集群中hadoop都分别启动那些进程,他们的作用分别是什么,尽量详细些。

3、请列出你所知道的hadoop调度器,并简要说明其工作方法。

4.flume不采集Nginx日志,通过logger4j采集日志,优缺点是什么?

在nginx采集日志时无法获取session的信息,然而logger4j则可以获取session的信息,logger4j的方式比较稳定,不会宕机。缺点:不够灵活,logger4j的方式和项目结合过滤紧密,

flume的方式就比较灵活,便于插拔式比较好,不会影响项目的性能。

5、请简述hadoop怎么实现二级排序?

6、hive如何优化

在优化时要注意数据的问题,尽量减少数据倾斜的问题,减少job的数量,同事对小的文件进行成大的文件,如果优化的设计那就更好了,因为hive的运算就是mapReduce所以调节mapreduce的参数也会使性能提高,如调节task的数目。

7、mapreduce如何优化

8、时钟三点一刻是多少度角?

7.5度

9、已知,玻璃球从某高楼落到地面会摔碎,楼的最大高度为100层,给你两个玻璃球,请你最快的测出,能使玻璃球摔碎的最低楼层.

先使用第一个小球,以每次10层的跨度,依次抛到地面,观察结果, 10层, 20层, 30层, 40层...., 如果在50层抛出的时候,第一颗小球摔破了,则说明玻璃球的极限高度在40层到50层之间, 再使用第二颗小球, 从41层,42层,43层... ,依次抛出,如果第二颗小球在第43层摔破,则43层为小球摔破的极限高度!


https://blog.csdn.net/xfg0218/article/details/52514585

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值