数据转储（Kafka-spark-hive）

最新推荐文章于 2023-05-23 14:31:34 发布

你看这人，真菜

最新推荐文章于 2023-05-23 14:31:34 发布

阅读量357

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43584847/article/details/97007145

版权

大数据专栏收录该内容

19 篇文章 1 订阅

订阅专栏

当时在研究大数据平台的时候，（Kafka-spark-hive）数据转储时一个难点，下面是一部分调研工作，只用于记录，不保证正确性，嘻嘻嘻

1问：kafka输出的是什么样子的数据？
1答：一般是json类型的数据。
2问：sparkstreaming 怎么处理来自kafka的数据？
2答：有两种模式。可利用Receiver 的方式，或者不利用。
3问：sparkstreaming处理完的数据输出是什么形式？
3答：json可以转换为DataFrame
4问：spark处理后的数据怎么存储到hive中？
4答：将DataFrame写进hive表里

部分资料来源：

这整个的实现过程，好像可以通过一段代码来实现
一体式操作，Spark消费kafkaf的数据,解析数据并将数据存入到Hive中，
详见博客：https://blog.csdn.net/u012164361/article/details/79742201

SparkStreaming整合Kafka时，通常Kafka发送的数据是以JSON字符串形式发送的，这里总结了五种SparkStreaming解析Kafka中JSON格式数据并转为DataFrame进行数据分析的方法。
详见博客：https://blog.csdn.net/shirukai/article/details/85211951

实例过程，感觉可能会有一点点的参考价值：
详见博客：https://www.cnblogs.com/kangoroo/p/7754581.html

首先列出讲述下面几种导入方式的数据和hive表。

导入：

本地文件导入到Hive表；
Hive表导入到Hive表;
HDFS文件导入到Hive表;
创建表的过程中从其他表导入;
通过sqoop将mysql库导入到Hive表；

导出：

Hive表导出到本地文件系统；
Hive表导出到HDFS；
通过sqoop将Hive表导出到mysql库；

你看这人，真菜

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据转储（Kafka-spark-hive）

1问：kafka输出的是什么样子的数据？1答：一般是json类型的数据。2问：sparkstreaming 怎么处理来自kafka的数据？2答：有两种模式。可利用Receiver 的方式，或者不利用。3问：sparkstreaming处理完的数据输出是什么形式？3答：json可以转换为DataFrame4问：spark处理后的数据怎么存储到hive中？4答：将DataFrame写进...
复制链接

扫一扫

专栏目录

你看这人，真菜

博客等级

码龄6年

361
原创

201
点赞

1087
收藏

88
粉丝

关注

私信

热门文章

分类专栏

基础学习 1篇
力扣LeetCode 225篇
面经总结 12篇
剑指 offer 69篇
Java 程序员面试笔记 6篇
大数据 19篇
Java 31篇
Hive 6篇
Kafka 2篇
Maven 2篇
算法与数据结构 28篇
sparkml 4篇

最新评论

[浙大数据结构] 01-复杂度3 二分查找 (20分)
RoseMicro: 有完整的代码吗？我这里一直显示各种重定义
Hadoop 出现用户定义错误解决方案
嘻嘻>_<: 会报这样的错：WARNING: HADOOP_SECURE_DN_USER has been replaced by HDFS_DATANODE_SECURE_USER. Using value of HADOOP_SECURE_DN_USER. 然后我把文章中添加的HADOOP_SECURE_DN_USER=hdfs删除了就好了。总之还是谢谢作者了
Mac 在使用git时， fatal: Could not read from remote repository.
p3095458523: 博主一只殿鹿有写，标题和这个文章的标题很像
一文了解 if, else if, else 区别和使用
Red561: if判断之后只剩一种情况了，这个时候用else if 还是else 好，跟性能有关系吗？
一文了解 if, else if, else 区别和使用
看见我了请叫我去学习: else if 可有可没有,多少个都无所谓, else 可以没有,但是只要有,就只能有一个,就一定是在判断结构的最后

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。