hive的优化
1.使用Explain命令,查看执行计划,不会真正的执行,可以详细的查看sql执行的每一个细节。
2.fetch指的是hive在对某些情况下可以不是用mapreduce,在配置文件中修改hive.fetch.task.conversion,在属性修改为more以后全局查找,字段查找,limit等都不走mapreduce。
3.大多数的hadoopjob需要hadoop完整的性能,对于一些数据量非常小的hive任务,触发查询执行计划的时间比实际执行job消耗的时间还多。Hive可以通过本地模式在单台机器上
原创
2020-12-27 15:49:28 ·
577 阅读 ·
0 评论