概述:本文主要实现Saprk SQL多表连接查询,并将结果存入新表。需求说明:数据库中存在emp和dept两张表,统计dept表中每个部门的人数逆序排序并存入统计表stat。
如图所示
1、创建统计表
CREATE TABLE `stat` (
`deptName` varchar(10) DEFAULT NULL,
`total` int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
2、创建Spark SQL项目,导入相关依赖
<dependencies>
<dependency>
<groupId>org.scala-lang</groupId>
<artifactId>scala-library</artifactId>
<version>2.11.8</version>
</dependency>
<!-- https://mvnrepository.com/artifact/org.apache.spark/spark-sql -->
<dependency>
<groupId>org.apache.spark</groupId>
<ar