KafKa
@TangXin
路漫漫其修远兮,吾将上下而求索。
展开
-
PrestoSQL-345集群连接Kafka2.2.1
文章目录1.Ambari 集群环境2.Kafka 导入数据3.Presto 配置4.执行数据查询操作5.添加 topic 描述文件6.将kafka topic中所有值映射到列上1.Ambari 集群环境部署Kafka组件,zookeeper组件,并启动。2.Kafka 导入数据在Ambari集群节点执行:下载:curl -o kafka-tpch https://repo1.maven.org/maven2/de/softwareforge/kafka_tpch_0811/1.0/kafka_t原创 2020-11-17 14:24:47 · 809 阅读 · 0 评论 -
认识KafKa-基本命令-及python实现
producerfrom kafka import KafkaProducerfrom kafka.errors import KafkaErrorimport jsonclass Kafka_producer(): ''' 使用kafka的生产模块 ''' def __init__(self, kafkahost, kafkaport, kafkat...原创 2019-01-12 14:36:51 · 286 阅读 · 0 评论 -
认识KafKa-Producer and Consumer
Producer and ConsumerProducer通过主动Push的方式将消息发布到Broker,Consumer通过Pull从Broker消费数据Pull的优点Consumer按实际处理能力获取相应的数据,不会被压垮Broker实现简单如果处理不好,实时性相对不足KafKad读写机制每个partition有一个leader和若干个Follower(replica)...原创 2019-01-12 09:30:11 · 394 阅读 · 0 评论 -
认识KafKa-数据一致性参数
partitions数据一致性KafKa中Producer发送消息到Broker,Broker有三种返回方式,分别为Noackleader commit成功就ackleader和follower同时commit成功才返回ack第三种方式是数据强一致性request.required.acksproducer向leader发送数据时,可以通过request.required.ac...原创 2019-01-11 16:18:30 · 2074 阅读 · 0 评论 -
认识KafKa-深入解析Leader和Follower数据同步机制(HW,LEO概念)
HW vs LEOLEO(LogEndOffset):表示每个partition的log最后一条Message的位置。HW(HighWatermark):表示partition各个replicas数据间同步且一致的offset位置,即表示allreplicas已经commit位置,每个Broker缓存中维护此信息,并不断更新。是指consumer能够看到的此partition位置。取一个p...原创 2019-01-11 11:30:46 · 2091 阅读 · 0 评论 -
认识KafKa-CAP理论-kafka复制
CAP理论(帽子理论)分布式系统中,一致性、可用性、分区容错性不可兼得,最多只可同时满足两个。C(Consistency 一致性):A read is guaranteed to return the most recent write for a given client.在分布式系统中的所有数据备份,在同一时刻是否同样的值。(等同于所有节点访问同一份最新的数据副本)注:在一个节...原创 2019-01-11 10:37:18 · 1730 阅读 · 0 评论 -
认识KafKa-KafKa架构深度剖析
为什么会有消息队列解耦扩展 能力持久化峰值处理能力可恢复消息队列种类ActivaMQ基于JMS规范支持事务KafKa轻量级,不完全服从JMS无状态代理消费者分组:每个消费者属于一个分组,每个消息可以被多个分组获得,但在一个分组中只有一个消费者获得主题和分区KafKa架构介绍生产者、消费者、Broker(代理)、ZookeeperTopicKa...原创 2019-01-10 20:31:07 · 232 阅读 · 0 评论