服务器本地文件加载到CarbonData与简单sql编写记录

本文介绍了如何将本地文件上传至HDFS并加载到CarbonData,包括HDFS的简单操作和SQL查询。步骤包括使用命令行工具传输文件、启动Spark、导入数据到CarbonData以及执行数据行数检查。此外,还分享了hdfs文件夹创建及SQL操作,如数据迁移、条件查询等。
摘要由CSDN通过智能技术生成

服务器本地文件加载到CarbonData与简单sql编写记录

一、加载文件到CarbonData:

1、首先可以传送文件到大数据平台,命令如下:

scp -r -P 端口号 主机名:/本地目录/完整的文件名 ~/服务器目录/

2、服务器上传本地文件到HDFS,命令如下:

hdfs dfs -put ~/服务器本地目录/完整的文件名称 /user/hdfs/hdfs下的目录

3、导入hdfs文件到CarbonData,首先需要启动Spark。

第一步:
cd $SPARK_HOME;
第二步:
./bin/spark-shell --master yarn-client --driver-memory 1g --executor-cores 2 --executor-memory 2G
第三步:
import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.CarbonSession._
val carbon = SparkSession.builder().config(sc.getConf).getOrCreateCarbonSession()
第四步:
创建数据库表
carbon.sql(s"""CREATE TABLE
                        IF NOT EXISTS 数据库.表名(
								  shopid string,
                                  url string,
								  price string,
								  title string,
								  count string,
								  createtime string,
                          
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值