Spark-SQL之Hive数据源

最新推荐文章于 2023-03-21 15:05:49 发布

S_Running_snail

最新推荐文章于 2023-03-21 15:05:49 发布

阅读量420

点赞数

分类专栏： spark 文章标签： SparkSQL

本文链接：https://blog.csdn.net/S_Running_snail/article/details/89281258

版权

Hive数据源Spark SQL支持对Hive中存储的数据进行读写。操作Hive中的数据时，必须创建HiveContext，而不是SQLContext。HiveContext继承自SQLContext，但是增加了在Hive元数据库中查找表，以及用HiveQL语法编写SQL的功能。除了sql()方法，HiveContext还提供了hql()方法，从而用Hive语法来编译sql。案例中讲解如下...

摘要由CSDN通过智能技术生成

Hive数据源

Spark SQL支持对Hive中存储的数据进行读写。操作Hive中的数据时，必须创建HiveContext，而不是SQLContext。HiveContext继承自SQLContext，但是增加了在Hive元数据库中查找表，以及用HiveQL语法编写SQL的功能。除了sql()方法，HiveContext还提供了hql()方法，从而用Hive语法来编译sql。

案例中讲解如下四个功能：

第一个功能：用HiveContext的sql()/hql()方法，可以执行hive中执行的HiveQL语句

第二个功能：执行sql还可以返回DataFrame

第三个功能：DataFrame中的数据保存到hive表中（row即可）

第四个功能：HiveContext.table()方法，针对hive表创建DataFrame

实例：

java版本：

package Spark_SQL.Hive_sql;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.

最低0.47元/天解锁文章

S_Running_snail

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark-SQL之Hive数据源

Hive数据源Spark SQL支持对Hive中存储的数据进行读写。操作Hive中的数据时，必须创建HiveContext，而不是SQLContext。HiveContext继承自SQLContext，但是增加了在Hive元数据库中查找表，以及用HiveQL语法编写SQL的功能。除了sql()方法，HiveContext还提供了hql()方法，从而用Hive语法来编译sql。案例中讲解如下...
复制链接

扫一扫