spark远程操作hive的一些列操作增删查

最新推荐文章于 2022-03-23 23:53:00 发布

忘川风华录

最新推荐文章于 2022-03-23 23:53:00 发布

阅读量1.7k

点赞数 1

分类专栏： spark hive 项目总结文章标签： spark hive

本文链接：https://blog.csdn.net/qq_36968512/article/details/84894958

版权

本文介绍了如何将Hive的计算引擎从MR切换到Spark，以提高查询效率。首先，需要将hive-site.xml配置文件复制到Spark目录，并在Windows上创建resources。接着，将MySQL的JAR包添加到Spark的JAR目录。程序中，通过参数接收SQL语句，通常将SQL写入文件以复用。

摘要由CSDN通过智能技术生成

因为老早之前配置hive的时候没有把hive的底层计算引擎改为spark，现在对hive的表进行查询的时候很慢，就想把MR换掉，于是这篇文章就诞生了，
首先做准备工作，你需要把hive的hive-site.xml拷贝到你的集群的spark目录下还要在你的win上创建一个resources
在这里插入图片描述
把这个文件拷贝之后
接着就是你吧mysql的jar拷贝到你工程的存放jar的目录下，然后拷贝到spark/jar下面如果没有点击下载mysql的jar包

然后就是咱们的程序如下

package csvToHive


import org.apache.spark.SparkConf
import org.apache.spark.sql. SparkSession

import scala.io.Source


object createHiveTable {


  def main(args: Array[String]): Unit = {


    //设置配置文件等
    val conf = new SparkConf()
      .setAppName(s"${this.getClass.getSimpleName}")
      .setMaster("spark://master:7077")    //如果是打jar包的时候这句话需要注释掉的

    //设置hive连接，既能连接hive也能读取文件
    val hive = SparkSession
      .builder()
      .enableHiveSuppo

最低0.47元/天解锁文章

忘川风华录

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark远程操作hive的一些列操作增删查

因为老早之前配置hive的时候没有把hive的底层计算引擎改为spark，现在对hive的表进行查询的时候很慢，就想把MR换掉，于是这篇文章就诞生了，首先做准备工作，你需要把hive的hive-site.xml拷贝到你的集群的spark目录下还要在你的win上创建一个resources把这个文件拷贝之后接着就是你吧mysql的jar拷贝到你工程的存放jar的目录下，然后拷贝到spark/j...
复制链接

扫一扫

专栏目录