spark streaming 消费kafka两种方式的对比

最新推荐文章于 2021-03-30 13:05:29 发布

yagch

最新推荐文章于 2021-03-30 13:05:29 发布

阅读量535

点赞数 1

分类专栏： spark streaming

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34897849/article/details/102691435

版权

1、读取数据的并发度

Receiver的方式：采用的是单核的模式，即使你设置了多个线程数，你的上下文环境中设置的并行度很大，也不会产生影响，还是1。只有通过配置多个receiver才会并行的读取kafka中的数据

Direct的方式：读取数据的并行度和topic的分区数相同，而且生成的DStream的并行度也和topic的分区数相同，一一对应。

2、生成的DSream的并行度

Receiver的方式：程序中Batch的间隔是4000ms，每Batch的数据构成一个RDD，在整个执行的环境中spark.streaming.blockInterval =100。生成的DStream的并发度是4000/100 =40

Direct的方式：生成的DStream的并行度也和topic的分区数相同，一一对应。

3、kafka日志文件

Receiver的方式：默认情况下这种方式读取的数据都是存在内存中的很容易导致OOM，如果要保证零数据丢失，必须

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark streaming 消费kafka两种方式的对比

1、读取数据的并发度Receiver的方式：采用的是单核的模式，即使你设置了多个线程数，你的上下文环境中设置的并行度很大，也不会产生影响，还是1。只有通过配置多个receiver才会并行的读取kafka中的数据Direct的方式：读取数据的并行度和topic的分区数相同，而且生成的DStream的并行度也和topic的分区数相同，一一对应。2、生成的DSream的并行度Receiv...
复制链接

扫一扫

专栏目录

yagch CSDN认证博客专家 CSDN认证企业博客

码龄8年

52: 原创

6万+: 周排名

40万+: 总排名

10万+: 访问

: 等级

1297: 积分

117: 粉丝

35: 获赞

5: 评论

183: 收藏

私信

关注

热门文章

分类专栏

hive 15篇
maxwell 2篇
mac 2篇
flink 4篇
datax 2篇
redis 1篇
docker 2篇
股 1篇
sublime 1篇
canal 1篇
linux 3篇
cdh 2篇
sentry 1篇
phoenix 1篇
spark streaming 1篇
kafka 3篇
hbase 2篇
sqoop 17篇
nifi 1篇
flume 1篇
mysql 4篇

最新评论

hive 存储元数据信息支持中文
陈淀薄发: 如果表之前的characterset 是latin，现在即使表的characterset改成了utf8，字段的编码依然没有改，字段的编码也需要手动改。
Maxwell读取MySQL binlog日志到Kafka
CSDN-Ada助手: 非常感谢CSDN博主分享的“Maxwell读取MySQL binlog日志到Kafka”的技术文章。我觉得这篇博客对于想要了解如何实现MySQL binlog日志到Kafka的读取操作的读者非常有帮助。下一篇博客可以继续深入探讨Kafka的应用，比如可以写一篇“使用Kafka实现分布式日志收集”的技术文章，相信会有更多读者受益。期待你的下一篇精彩分享！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
docker 安装mysql 开启binlog 每天备份数据
qq_张先生: 你这是全量备份啊
sqoop 4种密码使用模式
帅气可爱又任性的凯哥: 你好，请问，sqoop1.4.5支持别名模式吗？
hbase 2.1.0 编译phoenix5.0.0
benpaodexiaowoniu: 楼主，你的二级索引是如何避免建立后插删数据均不报错如下的：https://ask.csdn.net/questions/710412

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。