Flume入门安装部署

最新推荐文章于 2024-07-18 21:37:27 发布

ペ你值H

最新推荐文章于 2024-07-18 21:37:27 发布

阅读量351

点赞数 2

分类专栏：大数据 --- Flume 文章标签：大数据

本文链接：https://blog.csdn.net/ZHB__/article/details/108350791

版权

大数据 --- Flume 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.参数配置

Flume的安装非常简单，只需要解压即可，当然，前提是已有hadoop环境

上传安装包到数据源所在节点上

然后解压 tar -zxvf apache-flume-1.8.0-bin.tar.gz

根据数据采集的需求配置采集方案，描述在配置文件中(文件名可任意自定义)
指定采集方案配置文件，在相应的节点上启动flume agen

2.启动命令

bin/flume-ng agent -c ./conf

commands:

  help                      显示本帮助信息

  agent                     启动一个agent进程

  avro-client                 启动一个用于测试avro source的客户端（能够发送avro序列化流）

  version                    显示当前flume的版本信息

global options:   全局通用选项

  --conf,-c <conf>          指定flume的系统配置文件所在目录

  --classpath,-C <cp>        添加额外的jar路径

  --dryrun,-d               不去真实启动flume agent，而是打印当前命令

  --plugins-path <dirs>       指定插件（jar）所在路径

  -Dproperty=value          传入java环境参数

  -Xproperty=value          传入所需的JVM配置参数

agent options:

  --name,-n <name>          agent的别名（在用户采集方案配置文件中）

  --conf-file,-f <file>          指定用户采集方案配置文件的路径

  --zkConnString,-z <str>      指定zookeeper的连接地址

  --zkBasePath,-p <path>      指定用户配置文件所在的zookeeper path，比如：/flume/config

  --no-reload-conf            关闭配置文件动态加载

  --help,-h                   display help text

avro-client options:

  --rpcProps,-P <file>   RPC client properties file with server connection params

  --host,-H <host>     avro序列化数据所要发往的目标主机（avro source所在机器）

  --port,-p <port>      avro序列化数据所要发往的目标主机的端口号

  --dirname <dir>      需要被序列化发走的数据所在目录（提前准备好测试数据放在一个文件中）

  --filename,-F <file>   需要被序列化发走的数据所在文件(default: std input)

  --headerFile,-R <file> 存储header key-value的文件

  --help,-h             帮助信息

  Either --rpcProps or both --host and --port must be specified.

Note that if <conf> directory is specified, then it is always included first

in the classpath.