Kafka笔记

最新推荐文章于 2024-05-21 09:24:35 发布

VIP文章 Bourne-Wang

最新推荐文章于 2024-05-21 09:24:35 发布

阅读量110

点赞数

分类专栏： bigdata 文章标签： kafka java 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39952986/article/details/125526658

版权

Overall

Kafka起源于LinkedIn公司，用于对各业务系统的基础指标（内存/CPU/磁盘/网络等）和应用指标数据进行分析，自定义开发系统实现逐渐不能满足。
随着数据增长，业务需求复杂度提高，自定义开发问题越来越多。
逐渐进化成一个技能满足实时处理，又支持水平扩展的消息系统-Kafka。
是一个发布-订阅式的队列消息系统，使用scala语言编写，非常适合离线、在线消息消费。消息存储在磁盘上，并在集群内复制，防止数据丢失。

Advantages

可靠性：分布式的，分区复制容错；
可扩展：轻松扩展；
耐用性：消息会尽可能快速的保存在磁盘上
性能：对发布和订阅都有高吞吐量，即使对TB级的消息，也有稳定的性能；
速度：非常快

应用场景

指标分析
日志聚合：从多服务器收集日志，以标准的格式提供给多消费者。
流处理：配合spark/storm/flink流处理框架使用。

基本概念

Broker：即一个Kafka进程，通常一个服务器节点部署一个实例（Broker）
Producer: 消息的产生者，Producer将消息记录发送到Kafka集群指定的主题（Topic）中进行存储；
Consumer: 消息的使用者，Consumer从Kafka集群指定的主题（Topic）中读取消息记录；
Topic主题：通过主题来区分不同业务类型的消息。
Partition：每个主题可以有一个或多个分区（提供数据冗余、可靠性、高性能）

多个分区并发读取，提高吞吐量；
分区内部消息是有序的，每个消息有一个偏移量（Offset）；
一个代理节点内部可管理多个分区。
Replication副本：主题创建时指定副本数（默认1）
建议副本数量：
集群节点数量>=3时，副本=3;
节点小于3时，副本=节点数；

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Kafka笔记

Kafka起源于LinkedIn公司，用于对各业务系统的基础指标（内存/CPU/磁盘/网络等）和应用指标数据进行分析，自定义开发系统实现逐渐不能满足。随着数据增长，业务需求复杂度提高，自定义开发问题越来越多。逐渐进化成一个技能满足实时处理，又支持水平扩展的消息系统-Kafka。是一个发布-订阅式的队列消息系统，使用scala语言编写，非常适合离线、在线消息消费。...
复制链接

扫一扫

专栏目录

Bourne-Wang CSDN认证博客专家 CSDN认证企业博客

码龄7年

6: 原创

114万+: 周排名

113万+: 总排名

3129: 访问

: 等级

65: 积分

1: 粉丝

0: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

分类专栏

bigdata 4篇
laravel 1篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。