Spark（第六节—1）Spark中直接执行hive查询，Spark整合hive，SparkSQL的使用案例，Spark读取MySQL，Spark写入MySQL

最新推荐文章于 2023-05-13 16:51:58 发布

hwq317622817

最新推荐文章于 2023-05-13 16:51:58 发布

阅读量668

点赞数

文章标签： spark

本文链接：https://blog.csdn.net/hwq317622817/article/details/113870669

版权

Spark中直接执行hive查询

在未整合hive的情况下，Spark中直接执行hive查询，spark读取和操作的元数据是在hive自带derby数据库。需要spark与hive整合后才能将读取和操作hive在mysql的元数据。为了避免hive元数据出故障，最好是整合hive后再操作。
创建maven工程，pom如下：

<properties>
	<scala.version>2.11.8</scala.version>
	<spark.version>2.2.0</spark.version>
</properties>
<dependencies>
	<dependency>
		<groupId>org.scala-lang</groupId>
		<artifactId>scala-library</artifactId>
		<version>${scala.version}</version>
	</dependency>
	<dependency>
		<groupId>org.apache.spark</groupId>
		<artifactId>spark-core_2.11</artifactId>
		<version>${spark.version}</version>
	</dependency>
	<dependency>
		<groupId>org.apache.spark</groupId>
		<artifactId>spark-sql_2.11</artifactId>
		<version>${spark.version}</version>
	</dependency>
	<dependency>
		<groupId>org.apache.hadoop</groupId>
		<artifactId>hadoop-client</artifactId>
		<version>2.7.5</version>
	</dependency>
	<!-- spark连接hive的依赖 -->
	 <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-hive_2.11</artifactId>
            <version>2.2.0</version>
	</dependency>

</dependencies>
<build>
	<sourceDirectory>src/main/scala</sourceDirectory>
	<testSourceDirectory>src/test/scala</testSourceDirectory>
	<plugins>
		<plugin>
			<groupId>org.apache.maven.plugins</groupId>
			<artifactId>maven-compiler-plugin

最低0.47元/天解锁文章

hwq317622817

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Spark（第六节—1）Spark中直接执行hive查询，Spark整合hive，SparkSQL的使用案例，Spark读取MySQL，Spark写入MySQL

Spark中执行hql创建maven工程，pom如下：<properties> <scala.version>2.11.8</scala.version> <spark.version>2.2.0</spark.version></properties><dependencies> <dependency> <groupId>org.scala-lang</groupId&gt
复制链接

扫一扫