- 博客(3)
- 资源 (13)
- 收藏
- 关注
转载 一例 Hive join 优化实战
1、需求2、非等值 join 问题3、优化:reduce side join VS Cartesian product4、改写非等值 join:union all5、优化:map side join6、优化无极限:开启 parallel 和 控制 reduce 个数7、最后的问题:8、关于 hive 中的 笛卡尔集( full Cartesian product )
2015-04-30 00:25:58 5102
转载 HBase性能优化方法总结
本文主要是从HBase应用程序设计与开发的角度,总结几种常用的性能优化方法。有关HBase系统配置级别的优化,这里涉及的不多,这部分可以参考Hbase性能调优1. 表的设计1.1 Pre-Creating Regions默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户端都向这一个region写数据,直到这个region足够大
2015-04-29 22:22:27 1840
转载 hive性能调优
limit 限制调整-- 因为使用 limit 语句时候,是先执行整个查询语句,然后再返回部分结果的set hive.limit.optimize.enable=true;set hive.limit.row.max.size=10000;set hive.limit.optimize.limit.file=10;2.JOIN 优化。。。
2015-04-29 22:03:52 1959
hadoop-cdh4.6配置文件
2014-05-02
ext2Spring
2013-11-23
hadoopDemo-mapreduce
2013-11-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人