Linux 大数据如何启动，步骤如下

最新推荐文章于 2022-10-08 12:52:53 发布

Roam-G

最新推荐文章于 2022-10-08 12:52:53 发布

阅读量525

点赞数

分类专栏： Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41290863/article/details/112132609

版权

Python 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

启动步骤：

1.启动3台虚拟机【都用root登录】

2.启动hadoop：

start-all.sh，然后jps进行测试出现633

第一台 6

第二台3

第三台 3

讲真我刚开始就不知道 633什么意思。说的不明不白的。

3.启动3台zookeeper：

zkServer.sh start，jps出现744

第一台spark1 【7】

第一台spark2 【4】

第一台spark3 【4】

4.启动3台kafka：

kafka-server-start.sh /hadoop

fka213240/config

rver.properties，新建选项卡连接101，测试jps出现855

注意：启动之前需要vi /hadoop/kafka213240/config/server.properties (有3个地方要改)

修改其中broke.id为不同的值，如1，2，3【三台不同的虚拟机分别修改】

启动spark1

查看jps时是新建会话，

启动2

3台操作一样

5.连接数据库：[root@Spark1 zk356]# systemctl start mariadb

[root@Spark1 zk356]# mysql -uroot -p

MariaDB [(none)]> use mysql;

MariaDB [mysql]> select user,host from user;

MariaDB [mysql]> update user set host='%' where user='root' and host='localhost';

6.然后执行

kafka-console-consumer.sh --bootstrap-server spark1:9092,spark2:9092,spark3:9092 --topic laozhangX --from-beginning

7.新建选项卡【就是再打开一个界面，链接第一台虚拟机。这里使用的是xshell进行链接】，连接101，启动flume：flume-ng agent -c conf -f /hadoop/flume190/conf/flume_mysql.conf -n a1 -Dflume.root.logger=INFO,console

8.新建选项卡，连接101，执行python代码：进入代码路径执行spark-submit 文件名

附上详细步骤讲解【腾讯文档】最新版本Hadoop_SparkStreaming
https://docs.qq.com/doc/DQndtbUJDVWFnblJW

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Linux 大数据如何启动，步骤如下

启动步骤：1.启动3台虚拟机【都用root登录】2.启动hadoop：start-all.sh，然后jps进行测试出现633第一台 6第二台3第三台 3讲真我刚开始就不知道 633什么意思。说的不明不白的。3.启动3台zookeeper：zkServer.shstart，jps出现744第一台spark1 【7】第一台spark2 【4】第一台spark3 【4】4.启动3台kafka：kafka-server-start.s.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Roam-G 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。