![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
文章平均质量分 80
hive是基于 Hadoop 的一个数据仓库工具,它主要有2个功能:①可以将结构化的数据文件映射为一张数据库表
②可以将 HQL 语句转换为 MapReduce 程序
Distantfbc
这个作者很懒,什么都没留下…
展开
-
数仓|Hive性能调优(二)
这样比起上面调整mapper数时,又会多出两个参数,分别是mapred.min.split.size.per.node和mapred.min.split.size.per.rack,含义是单节点和单机架上的最小split大小。需要更改Hive的输入文件格式,即参数hive.input.format,默认值是org.apache.hadoop.hive.ql.io.HiveInputFormat,我们改成org.apache.hadoop.hive.ql.io.CombineHiveInputFormat。原创 2023-06-05 19:53:25 · 104 阅读 · 0 评论 -
数仓|Hive性能调优(一)
hive优化(1)原创 2023-06-05 11:57:56 · 134 阅读 · 0 评论