1

------------恢复内容开始------------

1 安装zookeeper

  1 下载 https://dlcdn.apache.org/zookeeper/zookeeper-3.8.0/apache-zookeeper-3.8.0-bin.tar.gz

  2 解压:

      tar -zxvf apache-zookeeper-3.8.0-bin.tar.gz

  3修改配置

    cd apache-zookeeper-3.8.0-bin/conf

    cp zoo_sample.cfg zoo.cfg 

    vi zoo.cfg 

    然后修改 dataDir=/home/zookeeper(默认额 tmp 会自动删除)

  4 启动 

   cd ../bin

   ./ zkServer.sh start

 

然后看到启动成功启动

[root@192 bin]# ./zkServer.sh start
ZooKeeper JMX enabled by default
Using config: /root/tools/apache-zookeeper-3.8.0-bin/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
  • 1.
  • 2.
  • 3.
  • 4.

  

  

 安装kafka 

  1 下载:

  2 解压

     tar -zxvf kafka_2.11-1.0.0.tgz

      3修改配置文件

      vi kafka_2.11-1.0.0/config/server.properties  

      修改 监听ip和端口 (可以不改) listeners=PLAINTEXT://192.168.1.200:9092

      修改数据文件的地址(不要放在零时目录)    log.dirs=/home/kafka-logs


    

 

  4 启动程序  

      cd ../bin

      ./kafka-server-start.sh -daemon ../config/server.properties

 

    日志文件在  kafka_2.11-1.0.0/logs下面

     log.dirs 指定的数数据文件的目录

   

一些配置文件参数解释: 

//当前机器在集群中的唯一标识,和zookeeper的myid性质一样(broker.id和host.name每个节点都不相同)
broker.id=0
//当前kafka对外提供服务的端口默认是9092listeners=PLAINTEXT://192.168.1.202:9092
//这个参数默认是关闭的,在0.8.1有个bug,DNS解析问题,失败率的问题。
host.name=hadoop1
//这个是borker进行网络处理的线程数
num.network.threads=3
//这个是borker进行I/O处理的线程数
num.io.threads=8
//发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
socket.send.buffer.bytes=102400
//kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
socket.receive.buffer.bytes=102400
//这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小
socket.request.max.bytes=104857600
//消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,
//如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个
log.dirs=/home/hadoop/log/kafka-logs
//默认的分区数,一个topic默认1个分区数
num.partitions=1
//每个数据目录用来日志恢复的线程数目
num.recovery.threads.per.data.dir=1
//默认消息的最大持久化时间,168小时,7天
log.retention.hours=168
//轮转时间,当需要删除指定小时之前的数据时,该设置项很重要
log.roll.hours=12
//这个参数是:因为kafka的消息是以追加的形式落地到文件,当超过这个值的时候,kafka会新起一个文件
log.segment.bytes=1073741824
//每隔300000毫秒去检查上面配置的log失效时间
log.retention.check.interval.ms=300000
//是否启用log压缩,一般不用启用,启用的话可以提高性能
log.cleaner.enable=false
//设置zookeeper的连接端口
zookeeper.connect=192.168.123.102:2181,192.168.123.103:2181,192.168.123.104:2181
//设置zookeeper的连接超时时间
zookeeper.connection.timeout.ms=6000
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.