大数据
文章平均质量分 50
天秤焕妍
这个作者很懒,什么都没留下…
展开
-
hive数据倾斜
hive数据倾斜定义:key分布不均匀 导致分发到不同的reduce上 个别reduce任务特别重 导致其他reduce都完成 而这些个别的reduce迟迟不完成原因:1.key分布不均匀2.map端数据倾斜 输入文件太多且大小不一3.reduce端数据倾斜 分区器问题解决方案:1.调解hive配置参数1)设置hive.map.aggr = true map端部分聚合 相当于...原创 2018-12-08 10:16:30 · 160 阅读 · 0 评论 -
hive的streaming:an error occurred when trying to close the Operator running your custom script.
在对hive 进行 select 查询的时候 我们可以编写 python 、php 、perl等脚本来进行相应的数据处理,我们要用到hive 的 transform 和 using。 在使用的时候容易报如图所示的错误:an error occurred when trying to close the Operator running your custom script.hive...原创 2018-12-14 14:29:36 · 3187 阅读 · 0 评论 -
基于eclipse工具使用 JDBC 连接 Hive
1.启动hadoop集群[hadoop@master ~]$ start-all.sh 2.启动元数据metastore[hadoop@master ~]$ hive --service metastoreStarting Hive Metastore Server18/12/19 14:48:55 WARN conf.HiveConf: HiveConf of name...原创 2018-12-20 11:46:17 · 892 阅读 · 0 评论