CarbonData编译、安装和集成Spark 2.2

最新推荐文章于 2019-08-30 18:35:10 发布

wuzhilon88

最新推荐文章于 2019-08-30 18:35:10 发布

阅读量1.9k

点赞数

分类专栏： spark 1.6.0 core 源码分析文章标签： CarbonData spark 编辑集成

本文链接：https://blog.csdn.net/wuzhilon88/article/details/78864735

版权

spark 1.6.0 core 源码分析专栏收录该内容

17 篇文章 0 订阅

订阅专栏

carbandata官网地址

一、编译

1、获取源码

git clone https://github.com/apache/carbondata.git

编译需要安装maven和jdk 1.7或者1.8

2、编译

mvn -DskipTests -Pspark-2.2 -Dspark.version=2.2.0 clean package

3、获取打包后的jar,打包后只有一个大的jar

$carbindata_home/carbondata/assembly/target/scala-2.11/carbondata_2.11-1.3.0-SNAPSHOT-shade-hadoop2.6.0.jar

二、安装和集群Spark 2.2

1、将carbondata_2.11-1.3.0-SNAPSHOT-shade-hadoop2.6.0.jar复制到$spark_home/jars/

cp $carbindata_home/carbondata/assembly/target/scala-2.11/carbondata_2.11-1.3.0-SNAPSHOT-shade-hadoop2.6.0.jar $spark_home/jars/

2、配置carbandata的配置文件到$spark_home/conf

cp carbon.properties $spark_home/conf

3、配置carbon.properties，同时进行参数调优，参数影响查询性能比较大

#################### System Configuration ##################
#Mandatory. Carbon Store path
carbon.storelocation=hdfs://hacluster/data/CarbonData/CarbonStore
#Base directory for Data files
carbon.ddl.base.hdfs.url=hdfs://hacluster/data/CarbonData/data
#Path where the bad records are stored
carbon.badRecords.location=/home/biadmin/tmp/wuzl/carbondata/Spark/badrecords

4、在$spark_home新建一个carbonlib目录

mkdir carbonlib

5、将$spark_home下的carbon.properties、spark-defaults.conf、spark-env.sh复制到carbonlib下

6、将$spark_home/jars/carbondata_2.11-1.3.0-SNAPSHOT-shade-hadoop2.6.0.jar 复制到carbonlib下

wuzhilon88

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
CarbonData编译、安装和集成Spark 2.2

carbandata官网地址一、编译1、获取源码git clone https://github.com/apache/carbondata.git编译需要安装maven和jdk 1.7或者1.82、编译mvn -DskipTests -Pspark-2.2 -Dspark.version=2.2.0 clean package3、获取打包后的jar,打包后只有一个大
复制链接

扫一扫

专栏目录