需求:
通过简单的Scala代码远程连接Hive,查询Hive表数据并将数据转存到本地。另外,用Scala查询到数据后,我们还可以将查询到的ResultSet集合转化为RDD或者DataFrame进行scala的算子运算
第一步:启动服务器以及需要的服务(hiveserver2)远程连接端口默认配置为10000
hive --service hiveserver2 10000
第二步:创建maven项目导入pom.xml依赖
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>com.cyy.sparkSql</groupId>
<artifactId>sparkSqlTest</artifactId>
<version>1.0-SNAPSHOT</version>
<properties>