- 博客(2)
- 资源 (1)
- 收藏
- 关注
转载 Spark性能优化指南——高级篇
原文链接:https://tech.meituan.com/spark-tuning-pro.html数据倾斜调优调优概述有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方案解决不同类型的数据倾斜问题,以保证Spark作业的性能。数据倾斜发生时的现象绝大多数task执行得都非常快,但个别task执行极慢。比如,...
2018-05-15 14:06:03 175
原创 Hive学习资料
Hive中内部表和外部表的区别:Hive 创建内部表时,会将数据移动到数据仓库指向的路径;若创建外部表,仅记录数据所在的路径,不对数据的位置做任何改变。在删除表的时候,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删除数据。这样外部表相对来说更加安全些,数据组织也更加灵活,方便共享源数据。默认创建的是内部表,加入external关键词则为创建外部表。 时期数和时点数的区别:时期数是一段...
2018-05-15 09:35:39 1186
DRCN超分论文,ppt和代码
2017-12-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人