spark从入门到放弃三十二:Spark Sql(5)hive sql 简述

最新推荐文章于 2024-05-07 19:24:58 发布

WQ同学

最新推荐文章于 2024-05-07 19:24:58 发布

阅读量3.3k

点赞数

分类专栏： java spark hive 文章标签： spark 数据库 hive sql 数据

本文链接：https://blog.csdn.net/u012957549/article/details/80032397

版权

java 同时被 3 个专栏收录

129 篇文章 0 订阅

订阅专栏

spark

122 篇文章 15 订阅

订阅专栏

hive

17 篇文章 0 订阅

订阅专栏

文章地址：http://www.haha174.top/article/details/256688
1 简述

Spark Sql 支持对Hive 中存储的数据进行读写。操作Hive中的数据时，可以创建HiveContext,而不是SqlContext.HiveContext 继承自SqlContext,但是增加了在Hive元数据库中查找表，以及用HiveQl 语法编写sql功能，除了sql方法之外还提供了hql方法，从而使用hive语法来编译sql。
使用HiveContext ,可以执行Hive的大部分功能，包括创建表，往表里导入数据以及用Sql 语句查询表中的数据，查询出来的结果是一个Row 数组。

2 保存数据

Spark Sql 还允许将数据保存到Hive 表中，调用DataFrame 的 saveAsTable 命令，即可将DataSet 中的数据保存到Hive 表中，于registerTempTable 不同saveAsTable 是会将DataFrame 中的数据物化到Hive 表中的，而且还会在Hive元数据库中创建表的元数据。
默认情况下SaveAsTable 会将一张Hive Manager Table ,也就是说，数据的位置都是由元数据库中的信息控制的。当ManagerTable 被删除时，表中的数据也会一并被删除。
RegisterTempTable 只是注册一个临时的表，只要Application 停止或者重启了，那么表就没有了。而saveAsTable 石创建物理化的表，无论Application 是否重启或者停止都会一直存在。

欢迎关注，更多福利

这里写图片描述

WQ同学

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
spark从入门到放弃三十二:Spark Sql(5)hive sql 简述

文章地址：http://www.haha174.top/article/details/2566881 简述Spark Sql 支持对Hive 中存储的数据进行读写。操作Hive中的数据时，可以创建HiveContext,而不是SqlContext.HiveContext 继承自SqlContext,但是增加了在Hive元数据库中查找表，以及用HiveQl 语法编写sql功能，除了s...
复制链接

扫一扫