HIVE
sinat_37333675
这个作者很懒,什么都没留下…
展开
-
Hive面试题
--建表 create table login_table( user_id string ,login_date string ); --插入测试数据 insert into login_table(user_id,login_date) values('001','20190301') ,('001','20190302') ,('001','20190304') ,('001','20190305') ,('001','20190306') ,('002','201903原创 2020-12-11 17:20:55 · 219 阅读 · 0 评论 -
hive优化
小表join大表 利用hive进行join连接操作,相较于MR有两种执行方案,一种为common join,另一种为map join ,map join是相对于common join的一种优化,省去shullfe和reduce的过程,大大的降低的作业运行的时间。 common join:两个map作业读取两张表,归并为emp的格式,然后经由reducer合并。最后能获取到join的连接结果。 map join:首先在本地生成一个local task 读取比较小的表,然后将表写入Hash Table File原创 2020-09-02 09:33:51 · 102 阅读 · 0 评论