前面我们使用storm的本地模式完成了词频统计,本节将以此为基础使用storm的集群模式进行词频统计。
1 系统、软件以及前提约束
- CentOS 7 64 工作站 作者的机子ip是192.168.100.200,请读者根据自己实际情况设置
- 已使用storm的本地模式进行词频统计
https://www.jianshu.com/p/cd7ef406d1b4 - 为去除权限对操作的影响,所有操作都以root进行
- 确保zookeeper已经启动
2 操作
- 1 在idea中进行maven的打包操作,生成spark-wordcount-1.0-SNAPSHOT.jar【作者生成的jar包是这个名字,请读者根据实际情况操作】,上传spark-wordcount-1.0-SNAPSHOT.jar到linux的/root目录下
- 2 启动nimbus, supervisor
cd /root/apache-storm-1.2.1/bin
# 启动nimbus
./storm nimbus
# 启动supervisor
./storm supervisor
- 3 提交jar包到storm服务
cd /root/apache-storm-1.2.1/bin
./storm jar /root/spark-wordcount-1.0-SNAPSHOT.jar WordCountSub wordcount
以上就是使用storm集群模式进行词频统计的过程。