大数据面试题

 

给定一个字符串 求最大的回文长度

 

 

小文件 过多了 什么危害?如何规避

block 影响了什么?

yarn的调度器哪几种?区别

container的理解  资源调优

vcore

yarn队列 公平队列

yarn的生产上调优参数?如何规划?内存最大化利用

hive

hive内部表 外部表的区别

hive外部表  静态 动态区别是什么

hive的 udf 如何永久生效

hive的sort by  order by  cluster by distrbute by的含义

sqoop

sqoop如何增量抽取到hive,对应hive表怎么设计

hbase

rowkey如何设计?举例  

hbase 的读写流程经过master吗?加入不经过,什么流程经过?

hbase的hbck命令?哪些故障?哪些命令?

phoenix

flume如何抽取数据  记录pos点  能支持递归

kafka ack有哪几种? 生产选择哪个?

kafka offset有绝对和相对的说法吗?

kafka offset如何寻找数据  复述流程

kafka生产者 和消费者生产上如何做监控?看数据即时消费?

spark

spark数据倾斜的解决方案

spark源码

reducebykey  groupbykey区别

repartition  coalesce区别

 

转载于:https://www.cnblogs.com/NeverGiveUp0/p/11182461.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值