![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
wangfeng216
这个作者很懒,什么都没留下…
展开
-
hive开窗
distribute by是控制在map端如何拆分数据给reduce端的。hive会根据distribute by后面列,对应reduce的个数进行分发,默认是采用hash算法。sort by为每个reduce产生一个排序文件。在有些情况下,你需要控制某个特定行应该到哪个reducer,这通常是为了进行后续的聚集操作。distribute by刚好可以做这件事。因此,distribute by经常和sort by配合使用。注:Distribute by和sort by的使用场景1.Map输出的文件大小原创 2020-08-13 10:45:28 · 386 阅读 · 0 评论 -
hive join return code 3
set hive.auto.convert.join=ture 解决原创 2020-08-13 10:42:45 · 562 阅读 · 0 评论