自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Flume与Kafka集成(对接)

1)配置flume(flume-kafka.conf) 在/opt/setup/flume-1.8/(Flume的安装目录)下创建jobs文件夹,创建conf文件vim flume-kafka.conf,添加内容: #define a1.sources = r1 a1.sinks = k1 a1.channels = c1 #source a1.sources.r1.type = exec a1...

2020-01-20 21:40:34 735

原创 Kafka集群部署以及常用命令

kafka集群部署 1、下载安装包 http://kafka.apache.org/downloads 或者在linux中使用wget命令下载安装包 wget http://mirrors.hust.edu.cn/apache/kafka/1.1.0/kafka_2.11-1.1.0.tgz 2、解压安装包 tar -zxvf/export/software/kafka_2.11-1.1.0.t...

2020-01-20 21:24:53 300

原创 Kafka消息数据积压问题

(1)如果是Kafka消费能力不足,则可以考虑增加 topic 的 partition 的个数,同时提升消费者组的消费者数量,消费数 = 分区数 (二者缺一不可) (2)若是下游数据处理不及时,则提高每批次拉取的数量。批次拉取数量过少(拉取数据/处理时间 < 生产速度),使处理的数据小于生产的数据,也会造成数据积压。 ...

2020-01-20 21:12:24 5502

原创 Kafka Producer的Ack机制

Kafka Producer的Ack机制 Kafka的Ack机制指producer的消息发送确认机制,其影响kafka集群的吞吐量和消息可靠性。 Ack=0,相当于异步发送,意味着producer不等待broker同步完成,消息发送完毕继续发送下一批信息。提供了最低延迟,但持久性最弱,当服务器发生故障时很可能发生数据丢失。如果leader死亡,producer继续发送消息,broker接收不到数据...

2020-01-20 20:21:51 2667

原创 序列化

Spark对接Hbase存入数据的序列化问题java.io.NotSerializableException: org.apache.hadoop.hbase.io.ImmutableBytesWritable 原因: ImmutableBytesWritable不能进行序列化(在Java中,如果类需要序列化需要实现Serializable) 而文件在经过网络传输时需要序列化(网络传输是二进制传输...

2019-12-11 22:22:36 140

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除