本篇博客继续HIVE,将所有HIVE优化相关的内容深入清楚:
hive 优化:
1)Map的优化
• 增加map的个数:
set mapred.map.tasks=10;
• 减少map的个数(合并小文件):
set mapred.max.split.size=100000000; set mapred.min.split.size.per.node=100000000; set mapred.min.split.size.per.rack=100000000; set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;