StructuredStreamingKafka配置问题以及group.id问题以及修改offsets问题

最新推荐文章于 2023-04-05 15:40:08 发布

拉普达男孩

最新推荐文章于 2023-04-05 15:40:08 发布

阅读量1.9k

点赞数

分类专栏：大数据文章标签： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ITwangnengjie/article/details/114640417

版权

读取Kafka数据的时候，KafkaSourceProvider 类中的createMicroBatchReader 函数体中有对option() 中设置的Kafka参数进行校验及设置默认参数:

必填参数：duisubscribe，startingOffsets，failOnDataLoss进行判断。

如果要对默认参数进行修改或者添加新的配置，通过 option("Kafka.xx","") 进行设置。由于在KafkaSourceProvider 类对Kafka设置的参数做了过滤处理因此，设置Kafka参数时，必须以kafka. 前缀开始：

切记！不是所有的Kafka参数都可以设置！

Kafka特定配置
Kafka自己的配置可以通过设置DataStreamReader.option与kafka.前缀，例如 stream.option("kafka.bootstrap.servers", "host:port")。有关可能的kafka参数，请参阅 Kafka使用者配置文档以获取与读取数据相关的参数，以及Kafka生产者配置文档以获取与写入数据相关的参数。

请注意，无法设置以下Kafka参数，并且Kafka源或接收器将引发异常：

group.id：Kafka源将自动为每个查询创建一个唯一的组ID。
auto.offset.reset：设置源选项startingOffsets以指定从何处开始。结构化流管理在内部管理哪些偏移量，而不是依靠 kafka使用者来执行此操作。这将确保在动态订阅新主题/分区时不会丢失任何数据。请注意，startingOffsets仅在启动新的流查询时适用，并且恢复将始终从查询中断的地方开始。
key.deserializer：始终使用ByteArrayDeserializer将键反序列化为字节数组。使用Data

最低0.47元/天解锁文章

拉普达男孩

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
StructuredStreamingKafka配置问题以及group.id问题以及修改offsets问题

读取Kafka数据的时候，KafkaSourceProvider 类中的createMicroBatchReader 函数体中有对option() 中设置的Kafka参数进行校验及设置默认参数:必填参数：duisubscribe，startingOffsets，failOnDataLoss进行判断。如果要对默认参数进行修改或者添加新的配置，通过 option("Kafka.xx","") 进行设置。由于在KafkaSourceProvider 类对Kafka设置的参数做了过滤处理因此，设置Ka
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。