- 博客(3)
- 收藏
- 关注
转载 Impala-JDBC使用方法
Cloudera-Impala JDBC是以版本JDBC4.0和JDBC4.1数据标准编译的。 Impala-JDBC的系统要求 Java版本要求: Impala版本要求: Impala(apache 单独)版本范围:impala1.0.1---impala2.5 或者:CDH版...
2017-02-21 15:57:00
804
转载 spark-alluxio生产环境的应用与实践
一、Alluxio由来起因 Alluxio(之前名为Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统。它统一了数据访问的方式,为上层计算框架和底层存储系统构建了桥梁。 应用只需要连接Alluxio即可访问存储在底层任意存储系统中的数据。此外,Alluxio的以...
2016-10-18 17:08:00
200
转载 Hive解决数据倾斜问题(GC overhead limit exceeded)的有效办法。
原因分析:在执行hive shell的时候map任务阶段执行到99%,而reduce节点只执行到33%人后就出现了上面的错误。自我解释:(1)上面的情况说明,在map阶段执行结束的时候,当垃圾回收器在回收map阶段所产生的对象,因为数据倾斜的原因所导致对象过大,所以不能...
2016-05-20 14:11:00
1507
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人