溫度
码龄6年
关注
提问 私信
  • 博客:9,400
    9,400
    总访问量
  • 5
    原创
  • 1,342,234
    排名
  • 4
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2019-05-16
博客简介:

weixin_45079319的博客

查看详细资料
个人成就
  • 获得1次点赞
  • 内容获得0次评论
  • 获得4次收藏
创作历程
  • 4篇
    2020年
  • 1篇
    2019年
成就勋章
TA的专栏
  • 笔记
兴趣领域 设置
  • 大数据
    hadoopspark
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Flume与Kafka集成(对接)

1)配置flume(flume-kafka.conf)在/opt/setup/flume-1.8/(Flume的安装目录)下创建jobs文件夹,创建conf文件vim flume-kafka.conf,添加内容:#definea1.sources = r1a1.sinks = k1a1.channels = c1#sourcea1.sources.r1.type = execa1...
原创
发布博客 2020.01.20 ·
752 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Kafka集群部署以及常用命令

kafka集群部署1、下载安装包http://kafka.apache.org/downloads或者在linux中使用wget命令下载安装包wget http://mirrors.hust.edu.cn/apache/kafka/1.1.0/kafka_2.11-1.1.0.tgz2、解压安装包tar -zxvf/export/software/kafka_2.11-1.1.0.t...
原创
发布博客 2020.01.20 ·
305 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Kafka消息数据积压问题

(1)如果是Kafka消费能力不足,则可以考虑增加 topic 的 partition 的个数,同时提升消费者组的消费者数量,消费数 = 分区数 (二者缺一不可)(2)若是下游数据处理不及时,则提高每批次拉取的数量。批次拉取数量过少(拉取数据/处理时间 < 生产速度),使处理的数据小于生产的数据,也会造成数据积压。...
原创
发布博客 2020.01.20 ·
5511 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Kafka Producer的Ack机制

Kafka Producer的Ack机制Kafka的Ack机制指producer的消息发送确认机制,其影响kafka集群的吞吐量和消息可靠性。Ack=0,相当于异步发送,意味着producer不等待broker同步完成,消息发送完毕继续发送下一批信息。提供了最低延迟,但持久性最弱,当服务器发生故障时很可能发生数据丢失。如果leader死亡,producer继续发送消息,broker接收不到数据...
原创
发布博客 2020.01.20 ·
2683 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

序列化

Spark对接Hbase存入数据的序列化问题java.io.NotSerializableException: org.apache.hadoop.hbase.io.ImmutableBytesWritable原因: ImmutableBytesWritable不能进行序列化(在Java中,如果类需要序列化需要实现Serializable)而文件在经过网络传输时需要序列化(网络传输是二进制传输...
原创
发布博客 2019.12.11 ·
149 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏