大数据的数据处理：通过spark对Hive表查询和添加数据

nfzhlk

已于 2022-01-30 13:30:31 修改

阅读量2.7k

点赞数

分类专栏：人工智能技术干货开发技术文章标签： hive spark big data

于 2022-01-30 13:28:54 首次发布

本文链接：https://blog.csdn.net/nfzhlk/article/details/122752193

版权

在处理大数据时，会用到spark平台，对于一些对实时性要求不高，但数据量比较大的场景，我们可以考虑将生成数据存入hive表中。那么怎么将数据按时间存入hive表中，怎么将hive表中的数据直接读取出来并做处理呢？废话不多说，直接上代码！

package spark;

import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SparkSession;
import systest.TestCaseResult;

import java.util.List;

public class SparkSqlHiveIO {
   

    public static Dataset<Row> getRowDataSetFromHive(SparkSession sparkSession, String querySqlText){
   
        Dataset<Row> rowDataset = null;
        try {
   
            rowDataset = sparkSession.sql(querySqlText);
        } catch

最低0.47元/天解锁文章

nfzhlk

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
大数据的数据处理：通过spark对Hive表查询和添加数据

在处理大数据时，会用到spark平台，对于一些对实时性要求不高，但数据量比较大的场景，我们可以考虑将生成数据存入hive表中。那么怎么将数据按时间存入hive表中，怎么将hive表中的数据直接读取出来并做处理呢？废话不多说，直接上代码！package spark;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.sql.Dataset;import org.apache.spark.sql.Row;import or
复制链接

扫一扫