![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/a5114be3d8b033614bf0143069b78372.png)
1.概念
carbondata是一种带索引的列型数据格式,用于大数据快速分析平台例如:hadoop、spark等。说白了:一种数据格式!
2. build CarbonData
由于CarbonData刚刚开源,目前官方文档不规范并且较少。
2.1 先决条件:
OS: centos(类unix OS)
Apache Maven(推荐版本3.3或更高版本)
Oracle Java 7或8
Apache Thrift 0.9.3
以上条件缺一不可
2.2 下载
git 下载carbondata
官网下载已经发行的版本。
地址:https://dist.apache.org/repos/dist/release/carbondata/1.1.0/
3. 构建命令
进入到cabondata 的目录下,运行构建命令
构建无需测试,默认情况下carbondata采用Spark 1.6.2进行构建
mvn -DskipTests clean package(默认)
carbondata也支持使用不同版本的Spark构建(