自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 编译Spark3.x,Spark3.x与Hadoop、Hive版本兼容问题的解决

编译Spark3.x1.修改 D:\source\spark-3.0.0\dev\make-distribution.sh将133行-151行注释,按如下方式修改VERSION=3.0.0SCALA_VERSION=2.12SPARK_HADOOP_VERSION=2.6.0-cdh5.16.2SPARK_HIVE=1#VERSION=$("$MVN" help:evaluate -Dexpression=project.version $@ 2>/dev/null\# .

2020-09-25 22:46:12 6191

原创 使用Azkaban过程中遇到的非常见问题以及解决办法

使用azkaban3.9遇到的问题启动azkaban并且安装插件遇到的问题启动azkaban报错1:Could not find variable substitution for variable(s) [jobtype.classpath->hadoop.classpath]错误信息:1) Error injecting constructor, azkaban.jobtype.JobTypeManagerException: azkaban.jobtype.JobTypeM

2020-09-07 11:36:58 9698 1

原创 Hive优化

Hive优化Hive优化思想:Hive是将符合SQL语法的字符串解析生成可以在Hadoop上执行的MapReduce的工具,所以学习MapReduce的原理对我们使用hive,优化hive有很大的帮助。使用Hive尽量按照分布式计算的一些特点来设计sql,可以提升效率。Hive性能优化时,把HiveQL当做M/R程序来读,即从M/R的运行角度来考虑优化性能,从更底层思考如何优化运算...

2018-12-06 19:20:52 351

翻译 mapreduce的shuffle过程(详解)

  Mapreduce的shuffle过程详解mapreduce框架内部核心工作机制详解示意图maptask之前,输入切片的划分如图,以一个wordcount的job为例,在文件输入目录下有a.txt,b.txt,c.txt 三个文件(/wordcount/input/a.txt,b.txt,c.txt),a.txt为200M,b.txt为180M,c.txt为100M。然后...

2018-11-19 22:37:38 264

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除