给定一个字符串 求最大的回文长度
小文件 过多了 什么危害?如何规避
block 影响了什么?
yarn的调度器哪几种?区别
container的理解 资源调优
vcore
yarn队列 公平队列
yarn的生产上调优参数?如何规划?内存最大化利用
hive
hive内部表 外部表的区别
hive外部表 静态 动态区别是什么
hive的 udf 如何永久生效
hive的sort by order by cluster by distrbute by的含义
sqoop
sqoop如何增量抽取到hive,对应hive表怎么设计
hbase
rowkey如何设计?举例
hbase 的读写流程经过master吗?加入不经过,什么流程经过?
hbase的hbck命令?哪些故障?哪些命令?
phoenix
flume如何抽取数据 记录pos点 能支持递归
kafka ack有哪几种? 生产选择哪个?
kafka offset有绝对和相对的说法吗?
kafka offset如何寻找数据 复述流程
kafka生产者 和消费者生产上如何做监控?看数据即时消费?
spark
spark数据倾斜的解决方案
spark源码
reducebykey groupbykey区别
repartition coalesce区别