今天面试了某电商公司数据开发,针对里面的部分问题,做个总结,顺带整理学习一波:
1.编程题:n个数求topk和前序遍历的递归非递归版本
2. hive中parquet格式的具体含义,与textfile比有什么不同,两者的适用场景有啥区别?
3. 拉链表相关
4. hive中并行执行
网上关于这些问题已经有很好的回答了,就不重复造轮子了。这里给出答案连接。
- 剑指offer原题。
- https://blog.csdn.net/yu616568/article/details/51868447
https://www.cnblogs.com/piaolingzxh/p/5469964.html
3.https://blog.csdn.net/mtj66/article/details/78019370/
https://blog.csdn.net/u014770372/article/details/77069518
4.https://blog.csdn.net/qiaochao911/article/details/8854528
后续待更新。。