streamset hive到mysql_如何使用StreamSets实时采集Kafka中嵌套JSON数据并写入Hive表

1.文档编写目的

96f47105ce96dba5afe30ec61cf8fdfd.png

内容概述

1.测试环境准备

2.配置StreamSets

3.创建Pipline及测试

4.总结

测试环境

1.RedHat7.3

2.CM和CDH版本为cdh5.13.3

3.Kafka2.2.0(0.10.0)

4.StreamSets3.3.0

前置条件

1.集群已启用Sentry

2.测试环境准备

1.准备测试的JSON数据

{

"school": 1,

"address": 2,

"no": "page",

"class": 3,

"students": [{

"name": "page1",

"teacher": "larry",

"age": 40

}, {

"name": "page2",

"teacher": "larry",

"age": 50

}, {

"name": "page3",

"teacher": "larry",

"age": 51

}]

}

(可左右滑动)

2.为sdc用户授权

由于集群已启用Sentry,所以这里需要为sdc用户授权,否则sdc用户无法向Hive库中创建表及写入数据

f964f18d124169acc22b0f1645f51d02.png

3.创建StreamSets的Pipline

1.登录StreamSets,创建一个kafka2hive_json的Pipline

959f09d61d77f70a10ff1623a1e1b53b.png

2.在Pipline流程中添加Kafka Consumer作为源并配置Kafka基础信息

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值