实时计算框架Storm本地模式搭建

安装依赖

通过ubuntu自带的软件包管理器安装java环境。 安装Java:

$ sudo apt-get install openjdk-7-jdk

检查是否安装完成:

$ java -version

1-1

检查python版本:

$ python -V

1-2

安装ZooKeeper

为了避免每次获取超级权限重复输入sudo 临时进入超级用户:

$ sudo -s

使用ctrl+d退出

定位目录:

# cd /usr/local/src

从阿里的源下载:

# wget http://mirrors.aliyun.com/apache/zookeeper/zookeeper-3.4.6/zookeeper-3.4.6.tar.gz

1-3

使用命令解压:

# tar -xzvf zookeeper-3.4.6.tar.gz

进入解压后的目录:

# cd zookeeper-3.4.6

1-4

从配置文件模板复制一份配置文件,这里无需修改:

# cp conf/zoo_sample.cfg conf/zoo.cfg

环境变量:

# export ZOOKEEPER_HOME=/usr/local/src/zookeeper-3.4.6

环境变量:

# export PATH=$ZOOKEEPER_HOME/bin:$PATH

启动服务器:

# ./bin/zkServer.sh start

测试:

# ./bin/zkCli.sh -server 127.0.0.1:2181

安装Storm

定位目录:

# cd /usr/local/src

下载(从阿里的源下载0.9.2版本):

# wget http://mirrors.aliyun.com/apache/storm/apache-storm-0.9.2-incubating/apache-storm-0.9.2-incubating.tar.gz
# tar -xzvf apache-storm-0.9.2-incubating.tar.gz
# cd ./apache-storm-0.9.2-incubating/

1-5

配置storm.yaml:

# vim ./conf/storm.yaml

(这里我使用vim,也可以使用如何文件编辑器,复制以下内容到文件,原先的内容全部注释)

storm.zookeeper.servers:
      - "localhost"
nimbus.host: "localhost"
storm.local.dir : "/var/storm"
ui.port : 8080
storm.messaging.transport: "backtype.storm.messaging.netty.Context" #--指定传输协议
storm.messaging.netty.server_worker_threads: 1   #--指定netty服务器工作线程数量
storm.messaging.netty.client_worker_threads: 1   #--指定netty客户端工作线程数量
storm.messaging.netty.buffer_size: 5242880    #--指定netty缓存大小
storm.messaging.netty.max_retries: 100   #--指定最大重试次数
storm.messaging.netty.max_wait_ms: 1000  #--指定最大等待时间(毫秒)
storm.messaging.netty.min_wait_ms: 100   #--指定最小等待时间(毫秒)

1-6

后台(通过命令后加&使进程后台执行,标准输出全部进入黑洞/dev/null)启动Storm服务:

# ./bin/storm nimbus >/dev/null 2>&1 &
# ./bin/storm supervisor>/dev/null 2>&1 &
# ./bin/storm ui >/dev/null 2>&1 &
# ./bin/storm logviewer > /dev/null 2>&1 &

访问ip:port即可进入Storm UI

1-7

-EOF-

文章来源:http://chih.me/Setting-up-a-Storm-Cluster.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
滴滴出行作为全球最大的移动出行平台,每天收集和需要分析处理的数据量非常大。这些数据形式多样:既包括存储于数据库中的业务数据,也包括各种API请求所记录的文本日志。此外,更大的挑战在于业务上需要我们实时的分析处理如此大规模的数据。从数据生成到可被分析查询,系统延迟在秒级。我们选用Druid/Samza/Kafka/Spark/Hadoop等开源技术栈,开发了符合Lambda architecture的OLAP系统。本次演讲我们以滴滴大数据实时监控系统为例,介绍滴滴实时计算系统架构所面临的挑战及相应解决方案。 滴滴大数据实时监控系统服务于滴滴各个业务线,对关键业务指标的变化进行实时监控。研发、产品、运营人员可以据此及时了解业务现状,发现系统问题、调整业务决策。 演讲主要包括以下话题: 1. 实时计算的挑战及解决方案: (1)可扩展性 (2)有状态的实时计算 (3)数据被重复处理 (4)高可用 (5)实时数据流与外部系统或服务关联计算 2. OLAP系统架构选型:KV store与column store 哪种存储更适合OLAP应用? 3. 简要介绍Kafka的特性,阐述为何Kafka是实时计算系统中理想的数据存储方案 4. 详细介绍Druid的架构设计及原理,阐述Druid作为OLAP解决方案的优点 5. 详细介绍Samza的架构设计及原理,阐述如何通过Samza解决实时计算中的各种挑战 6. 介绍Lambda architecture,阐述如何将离线计算实时计算统一起来,通过离线计算来修正实时计算

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值