Flume多路复用模式把接收数据注入kafka 的同时，将数据备份到HDFS目录

HaveAGoodDay.

已于 2023-03-15 21:31:37 修改

阅读量2.5k

点赞数 4

分类专栏： Flume 大数据应用开发赛项 Hadoop 文章标签：大数据 flume kafka hadoop hdfs Powered by 金山文档

于 2023-03-15 21:30:26 首次发布

本文链接：https://blog.csdn.net/HaveAGoodDay428/article/details/129569014

版权

大数据应用开发赛项同时被 3 个专栏收录

16 篇文章 94 订阅

订阅专栏

Hadoop

8 篇文章 1 订阅

订阅专栏

Flume

2 篇文章 1 订阅

订阅专栏

启动hadoop、在hdfs中创建需要访问的目录

配置Hadoop的核心配置文件

core-site.xml：设置Hadoop的核心配置参数，例如NameNode的地址、数据块大小、副本数量等。示例配置如下：

<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
  </property>
</configuration>

hdfs-site.xml：设置HDFS（Hadoop分布式文件系统）的参数，例如数据块复制因子、NameNode的存储路径等。示例配置如下：

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/opt/hadoop-3.3.0/data/namenode</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/opt/hadoop-3.3.0/data/datanode</value>
  </property>
</configuration>

mapred-site.xml：如果使用MapReduce框架，则需要配置该文件，设置JobTracker的地址等信息。示例配置如下：

<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

格式化NameNode。在终端中输入以下命令：

hdfs namenode -format

需要注意的是，格式化会删除所有已有的HDFS数据，所以需要谨慎执行。

配置Hadoop集群的JAVA_HOME

vim ./etc/hadoop/hadoop-env.sh

#添加JAVA_HOME路径
export JAVA_HOME = /opt/jdk-8

启动Hadoop集群。在终端中输入以下命令：

start-all.sh

如果一切正常，Hadoop集群将启动成功

创建hdfs存储目录

hdfs dfs -mkdir -p /user/test/flumebackup

查看是否有该目录

hdfs dfs -ls -R /user/

2.启动zookeeper、kafka并创建主题

因为我已经做了一遍该配置，请移步至→

https://blog.csdn.net/HaveAGoodDay428/article/details/129567879

3.配置flume配置文件并启动flume

创建flume配置文件flume-kafka.conf

启动Flume

./bin/flue-ng agent -n a1 -c conf -f ./conf/flume-kafka.conf -Dflume.root.logger=INFO,console

4.netcat向本地10050端口发送socket数据

nc localhost 10050

可以通过查看hdfs存储目录中每次发送socket数据时是否新增文件

HaveAGoodDay.

关注

4
点赞
踩
36

收藏

觉得还不错? 一键收藏
6
评论
Flume多路复用模式把接收数据注入kafka 的同时，将数据备份到HDFS目录

Flume多路复用模式把接收数据注入kafka 的同时，将数据备份到HDFS目录
复制链接

扫一扫

专栏目录

Flume多路复用模式把接收数据注入kafka 的同时，将数据备份到HDFS目录

启动hadoop、在hdfs中创建需要访问的目录

2.启动zookeeper、kafka并创建主题

3.配置flume配置文件并启动flume

4.netcat向本地10050端口发送socket数据

“相关推荐”对你有帮助么？