Hive
# Hive
Yuan_CSDF
被大数据埋没的销售人才
展开
-
hive partition by
原始数据:name class sa1 2 74a2 1 95a3 1 95a4 1 80a5 2 92a6 3 99a7 3 99a8 3 ...原创 2020-03-28 14:11:44 · 3772 阅读 · 1 评论 -
hive的学习_优化
一.表连接:1.将大表放后头Hive假定查询中最后的一个表是大表。它会将其它表缓存起来,然后扫描最后那个表。因此通常需要将小表放前面,或者标记哪张表是大表:/*streamtable(table_name) */。否则会引起磁盘和内存的大量消耗。2. 使用相同的连接键当对3个或者更多个表进行join连接时,如果每个on子句都使用相同的连接键的话,那么只会产生一个MapReduce job...原创 2018-08-15 15:05:04 · 290 阅读 · 0 评论