面试小结(软通动力-驻平安数据开发)

面试小结(软通动力-驻平安数据开发)
主要考察知识面:Hadoop、Hive、MySQL
1.绘制一个项目框架
2.Hadoop组件
3.Hive动态分区
4.UDF使用过程(导包/classpath/自定义函数方法)
5.Hive数据倾斜的原因和方法
6.hive和传统数据库的区别(查询语言/数据格式/索引有无/执行/可扩展性/执行延迟/数据规模)
7.hive分区在hdfs中怎么体现
8. 案例题:40G的手机号,大小远大于内存,求出重复号码的Top10(大表拆若干小表;小表求重复号码的Top10,得到临时表; 小表合并,二次 计算排序,得到全表的top10)
9. 还有一些其他的,忘了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值