kafka
codemosi
hadoop hive hbase mahout storm spark kafka flume,等连载中,做个爱分享的人。
干一件事,干好一件事!
QQ :1606588828
展开
-
Kafka使用及开发概要(转载)
Kafka是linkedin用于日志处理的分布式消息队列,linkedin的日志数据容量大,但对可靠性要求不高,其日志数据主要包括用户行为(登录、浏览、点击、分享、喜欢)以及系统运行日志(CPU、内存、磁盘、网络、系统及进程状态)。当前很多的消息队列服务提供可靠交付保证,并默认是即时消费(不适合离线)。高可靠交付对linkedin的日志不是必须的,故可通过降低可靠性来提高性能,同时通过构建转载 2015-01-07 15:47:36 · 521 阅读 · 0 评论 -
kafka的配置
通常而言我们的kafka的配置如下所示:?12345678910111213141516broker.id=0num.network.threads=2num.io.threads=8socket转载 2015-03-02 09:26:20 · 643 阅读 · 0 评论 -
kafka api 开发常忽略的事
在windows下开发连接linux 中的kafka集群的,java api中容易忽略,导致出现如下错误kafka Failed to send messages after 3 tries.解决办法修改 C:\Windows\System32\drivers\etc\hosts# 127.0.0.1 localhost# ::1原创 2015-03-25 15:26:29 · 512 阅读 · 0 评论 -
kafka shell 命令
bin/kafka-list-topic.sh --zookeeper 192.168.197.170:2181,192.168.197.171:2181 (列出所有topic的分区情况)bin/kafka-list-topic.sh --zookeeper 192.168.197.170:2181,192.168.197.171:2181 --topic test (查看test的分区情况)原创 2015-05-14 18:31:58 · 4406 阅读 · 0 评论 -
storm读kafka数据源保证消息不丢失的方法
ack设置成-1 unclean设置为false就不丢数了,除非所有集群都同时挂,磁盘缓存没刷新再设置个mini isr=2更大保证一下如果你们ack设置的默认为1,那么切换leader的时候丢数很正常看你们的需求了,吞吐量跟性能做个平衡还有topic级别两个配置ack是生产者的unclean、mini isr是top原创 2015-07-10 19:33:11 · 2559 阅读 · 0 评论