sparksql源码学习-环境安装

前言

一、安装idea、jdk、maven

1.1 安装开发工具idea

  • 官网安装,我这里安装的是 idea 2021.3.2

在这里插入图片描述

1.2 安装jdk

  • 官网下载
    • 我下载的 jdk-8u201-macosx-x64.dmg ,这里你直接搜索,下载就行
    • 不想申请账号,jdl官网账号和密码,大家复制一下账号密码下载就完事了
      在这里插入图片描述

1.3 安装maven、git

1.4 安装 antlr和scala插件

  • 重启后生效

在这里插入图片描述

二、spark源码导入idea

  • url
https://github.com/apache/spark

在这里插入图片描述

  • 报错
unable to access 'https://github.com/apache/spark/': HTTP/2 stream 1 was not closed cleanly before end of the underlying stream
  • 原因
    • 网上说是git默认使用的通信协议出现了问题,可以通过将默认通信协议修改为 http/1.1 来解决该问题
  • 解决
git config --global http.version HTTP/1.1
  • 后来又是各种报错
  • 解决:修改缓冲区的大小、修改下载速度、关闭ssl证书校验
git config --global http.postBuffer 5242880000
git config --global http.lowSpeedLimit 0 
git config --global http.lowSpeedTime 999999
git config --global http.sslVerify "false"
  • 查看
cat .gitconfig
  • 拉了好几次才拉下来(卡在百分之90多失败了好几次)

三、切到branch3.2&编译

  • checkout 3.2 版本
    在这里插入图片描述
  • Resolving Maven dependencies 要很久,设置下maven Importing的jvm参数
-Xms1024m -Xmx2048m

在这里插入图片描述

  • spark源码包下开始编译
mvn clean package -Phive -Phive-thriftserver -Pyarn -DskipTests

在这里插入图片描述

  • 编译成功~
    在这里插入图片描述

四、运行测试类

4.1 测试 PlanParserSuite

  • 运行 PlanParserSuite.scala
    在这里插入图片描述

  • 报错

object SqlBaseParser is not a member of package org.apache.spark.sql.catalyst.parser
import org.apache.spark.sql.catalyst.parser.SqlBaseParser._
  • 原因
    • idea不会自动下载部分catalyst相关的源文件,导致编译时不能通过。
  • 解决
    在这里插入图片描述

4.2 测试 SQLQuerySuite

  • 运行 SQLQuerySuite.scala
sql/core/src/test/scala/org/apache/spark/sql/SQLQuerySuite.scala

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值