spark-sql on hive配置 thriftserver

版本

spark-2.1.3-bin-hadoop2.7

hive-site.xml

<configuration>
        <property>
                <name>javax.jdo.option.ConnectionURL</name>
                <value>jdbc:mysql://bigdata02:3306/hive?createDatabaseIfNotExist=true&amp;useSSL=false</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionDriverName</name>
                <value>com.mysql.jdbc.Driver</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionUserName</name>
                <value>root</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionPassword</name>
                <value>123456</value>
        </property>


        <property>
                <name>hive.insert.into.multilevel.dirs</name>
                <value>true</value>
                <description>允许生成多级目录</description>
        </property>

        <property>
                <name>hive.exec.stagingdir</name>
                <value>/home/tools/spark/spark-2.1.3-bin-hadoop2.7/hive_tmp</value>
                <description>临时文件暂放目录</description>
        </property>

        <property>
                <name>hive.metastore.warehouse.dir</name>
                <value>hdfs://bigdata02:9000/user/hive/warehouse</value>
        </property>
        <--
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://bigdata02:9000</value>
        </property>
        -->

        <property>
                <name>hive.server2.thrift.bind.host</name>
                <value>bigdata01</value>
                <description>ip配置</description>
        </property>

        <property>
                <name>hive.server2.thrift.port</name>
                <value>10001</value>
                <description>端口配置</description>
        </property>
        <property><!--设置匿名用户为超级管理员有最高权限-->
    	    <name>hive.users.in.admin.role</name>
	        <value>anonymous</value>
        </property>
</configuration>

spark-defaults.conf

spark.yarn.jars hdfs://mini:9000/home/hadoop/spark_jars/*
spark.sql.adaptive.enabled true

spark-env.sh

export JAVA_HOME=/usr/local/jdk/jdk1.8.0_251
export HADOOP_HOME=/home/tools/hadoop/hadoop-2.7.3
export HADOOP_CONF_DIR=/home/tools/hadoop/hadoop-2.7.3/etc/hadoop
export YARN_CONF_DIR=/home/tools/hadoop/hadoop-2.7.3/etc/hadoop
export SPARK_HOME=/home/tools/spark/spark-2.1.3-bin-hadoop2.7

//将hadoop的配置文件放在spark_home/conf 目录下

将spark目录下的lib包上传到配置文件指定的目录 hdfs://bigdata01:9000/home/hadoop/spark_jars/*

启动

./spark-sql \
--master yarn-client \   #使用yarn集群启动
--num-executors 3 \      #配置执行者数量
--executor-memory 3G \   #配置每一个执行者的内存
--executor-cores 3       #配置每一个执行者的cpu核心数

使用thriftserver服务启动

spark_home/sbin/start-thriftserver.sh \
--master yarn \
--num-executors 3 \
--executor-memory 3G \
--executor-cores 3

连接sparksql

 spark_home/bin/beeline -u jdbc:hive2://bigdata01:10001/

创建表并导入数据

create table data_table(id int,group1 string,group2 string,value1 int,value2 int,value3 int,date string) row format delimited fields terminated by ',' stored as textfile

load data inpath 'hdfs://bigdata01:9000/tempdata/sparksql' into table data_table

进行数据查询

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小钻风巡山

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值