1.内部表和外部表的区别?
2.MapReduce的工作流程?
3.hive的数据倾斜怎么解决?
4.分区表和分桶表的区别?
5.数仓是怎么建模的?
6.order by和sort by的区别?
7.hive的动态分区怎么实现?
8.有没有实现过UDF函数,在什么场景用到的?
9.mapreduce过程中map大小是多少?
10.hive的优化参数有哪些,举例说明用途?
11.sql题 连续3天登录的用户?(经典sql题)
12.left join时候大表应该放在左边还是右边?
13.union和 union all的区别?
14.rm -r file* 报文件太多,怎么解决?
15.crontab 5个* 分别代表什么?
16.HDFS的读写流程?
17.linux查询进程的命令
18.查找根目录下a名称文件的命令
19.Hive中大表和小表关联怎么做优化
20.雪花模型,星型模型,星座模型的区别
21.行转列,列转行的关键字
数仓面试经
于 2021-09-23 11:29:21 首次发布